功能

首页 > 功能

万相2.1是什么？一文让你看懂万相2.1的技术原理、主要功能、应用场景

万相2.1概述简介万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构，增强时空上下文建模能力，支持无限长1080P视频的高效...
星火纪要是什么？一文让你看懂星火纪要的技术原理、主要功能、应用场景

星火纪要概述简介星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台，广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效...
Hallo3是什么？一文让你看懂Hallo3的技术原理、主要功能、应用场景

Hallo3概述简介 Hallo3是复旦大学和百度公司联合推出的，基于扩散变换器网络（Diffusion Transformer Networks）...
rStar-Math是什么？一文让你看懂rStar-Math的技术原理、主要功能、应用场景

rStar-Math概述简介 rStar-Math是微软亚洲研究院推出的创新研究项目，基于蒙特卡洛树搜索（MCTS）驱动的深度思考，使小型语言大模型...
SPAR3D是什么？一文让你看懂SPAR3D的技术原理、主要功能、应用场景

SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的，先进的单图生成3D模型方法，能从单张图像中高效重建出高质量...
Search-o1是什么？一文让你看懂Search-o1的技术原理、主要功能、应用场景

Search-o1概述简介 Search-o1是中国人民大学和清华大学推出的创新框架，能提升大型推理模型（LRMs）在面对复杂问题时的推理能力。基于...
ConceptMaster是什么？一文让你看懂ConceptMaster的技术原理、主要功能、应用场景

ConceptMaster概述简介 ConceptMaster是用于多概念视频定制的创新框架，能在无需测试时调优的情况下，在扩散Transforme...
日日新融合大模型是什么？一文让你看懂日日新融合大模型的技术原理、主要功能、应用场景

日日新融合大模型概述简介 “日日新”融合大模型（SenseNova）是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态，...
Agent Laboratory是什么？一文让你看懂Agent Laboratory的技术原理、主要功能、应用场景

Agent Laboratory概述简介 Agent Laboratory是AMD和约翰·霍普金斯大学推出，基于大型语言大模型（LLM）的自主研究框...
新言意码是什么？一文让你看懂新言意码的技术原理、主要功能、应用场景

新言意码概述简介新言意码是专注于AI编程应用开发的公司，由前月之暗面海外产品Noisee的明超平创立。公司全称深圳新言意码科技有限公司，成立于20...
PPTAgent是什么？一文让你看懂PPTAgent的技术原理、主要功能、应用场景

PPTAgent概述简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架，基于模仿人类工作流程的两阶段编辑方法，从文档自动生...
HoloDrive是什么？一文让你看懂HoloDrive的技术原理、主要功能、应用场景

HoloDrive概述简介 HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生...
Perception-as-Control是什么？一文让你看懂Perception-as-Control的技术原理、主要功能、应用场景

Perception-as-Control概述简介 Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架，能根据用户意图...
Motion Dreamer是什么？一文让你看懂Motion Dreamer的技术原理、主要功能、应用场景

Motion Dreamer概述简介 Motion Dreamer是香港科技大学（广州）研究者提出的视频生成框架，生成运动合理视频。基于两阶段生成方...
Sky-T1是什么？一文让你看懂Sky-T1的技术原理、主要功能、应用场景

Sky-T1概述简介 Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI大模型，名为Sky-...
FaceLift是什么？一文让你看懂FaceLift的技术原理、主要功能、应用场景

FaceLift概述简介 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术，能从单一的人脸图像中重建出360度的...
SVFR是什么？一文让你看懂SVFR的技术原理、主要功能、应用场景

SVFR概述简介 SVFR（Stable Video Face Restoration）是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统...
TimesFM 2.0是什么？一文让你看懂TimesFM 2.0的技术原理、主要功能、应用场景

TimesFM 2.0概述简介 TimesFM 2.0是谷歌研究团队推出的开源时间序列预测模型。具备强大的预测能力，可处理长达2048个时间点的单变...
NeuralSVG是什么？一文让你看懂NeuralSVG的技术原理、主要功能、应用场景

NeuralSVG概述简介 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络，将文本提示转化为具有层次结构的矢量图形...
ViTPose是什么？一文让你看懂ViTPose的技术原理、主要功能、应用场景

ViTPose概述简介 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络，通...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL