收集全球10,000⁺个好用的AI软件
-
万相2.1是什么?一文让你看懂万相2.1的技术原理、主要功能、应用场景万相2.1概述简介 万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效...
-
星火纪要是什么?一文让你看懂星火纪要的技术原理、主要功能、应用场景星火纪要概述简介 星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台,广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效...
-
Hallo3是什么?一文让你看懂Hallo3的技术原理、主要功能、应用场景Hallo3概述简介 Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)...
-
rStar-Math是什么?一文让你看懂rStar-Math的技术原理、主要功能、应用场景rStar-Math概述简介 rStar-Math是微软亚洲研究院推出的创新研究项目,基于蒙特卡洛树搜索(MCTS)驱动的深度思考,使小型语言大模型...
-
SPAR3D是什么?一文让你看懂SPAR3D的技术原理、主要功能、应用场景SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量...
-
Search-o1是什么?一文让你看懂Search-o1的技术原理、主要功能、应用场景Search-o1概述简介 Search-o1是中国人民大学和清华大学推出的创新框架,能提升大型推理模型(LRMs)在面对复杂问题时的推理能力。基于...
-
ConceptMaster是什么?一文让你看懂ConceptMaster的技术原理、主要功能、应用场景ConceptMaster概述简介 ConceptMaster是用于多概念视频定制的创新框架,能在无需测试时调优的情况下,在扩散Transforme...
-
日日新融合大模型是什么?一文让你看懂日日新融合大模型的技术原理、主要功能、应用场景日日新融合大模型概述简介 “日日新”融合大模型(SenseNova)是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态,...
-
Agent Laboratory是什么?一文让你看懂Agent Laboratory的技术原理、主要功能、应用场景Agent Laboratory概述简介 Agent Laboratory是AMD和约翰·霍普金斯大学推出,基于大型语言大模型(LLM)的自主研究框...
-
新言意码是什么?一文让你看懂新言意码的技术原理、主要功能、应用场景新言意码概述简介 新言意码是专注于AI编程应用开发的公司,由前月之暗面海外产品Noisee的明超平创立。公司全称深圳新言意码科技有限公司,成立于20...
-
PPTAgent是什么?一文让你看懂PPTAgent的技术原理、主要功能、应用场景PPTAgent概述简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生...
-
HoloDrive是什么?一文让你看懂HoloDrive的技术原理、主要功能、应用场景HoloDrive概述简介 HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生...
-
Perception-as-Control是什么?一文让你看懂Perception-as-Control的技术原理、主要功能、应用场景Perception-as-Control概述简介 Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图...
-
Motion Dreamer是什么?一文让你看懂Motion Dreamer的技术原理、主要功能、应用场景Motion Dreamer概述简介 Motion Dreamer是香港科技大学(广州)研究者提出的视频生成框架,生成运动合理视频。基于两阶段生成方...
-
Sky-T1是什么?一文让你看懂Sky-T1的技术原理、主要功能、应用场景Sky-T1概述简介 Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI大模型,名为Sky-...
-
FaceLift是什么?一文让你看懂FaceLift的技术原理、主要功能、应用场景FaceLift概述简介 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的...
-
SVFR是什么?一文让你看懂SVFR的技术原理、主要功能、应用场景SVFR概述简介 SVFR(Stable Video Face Restoration)是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统...
-
TimesFM 2.0是什么?一文让你看懂TimesFM 2.0的技术原理、主要功能、应用场景TimesFM 2.0概述简介 TimesFM 2.0是谷歌研究团队推出的开源时间序列预测模型。具备强大的预测能力,可处理长达2048个时间点的单变...
-
NeuralSVG是什么?一文让你看懂NeuralSVG的技术原理、主要功能、应用场景NeuralSVG概述简介 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络,将文本提示转化为具有层次结构的矢量图形...
-
ViTPose是什么?一文让你看懂ViTPose的技术原理、主要功能、应用场景ViTPose概述简介 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通...