收集全球10,000⁺个好用的AI软件
-
MARS是什么?一文让你看懂MARS的技术原理、主要功能、应用场景MARS概述简介 MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MA...
-
HART是什么?一文让你看懂HART的技术原理、主要功能、应用场景HART概述简介 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直...
-
LEOPARD是什么?一文让你看懂LEOPARD的技术原理、主要功能、应用场景LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD...
-
CLEAR是什么?一文让你看懂CLEAR的技术原理、主要功能、应用场景CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意...
-
SPAR是什么?一文让你看懂SPAR的技术原理、主要功能、应用场景SPAR概述简介 SPAR是智谱团队推出的自我博弈框架,能增强大型语言大模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成...
-
STAR是什么?一文让你看懂STAR的技术原理、主要功能、应用场景STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(...
-
SPAR3D是什么?一文让你看懂SPAR3D的技术原理、主要功能、应用场景SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量...
-
UI-TARS是什么?一文让你看懂UI-TARS的技术原理、主要功能、应用场景UI-TARS概述简介 UI-TARS是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交...
-
VARGPT是什么?一文让你看懂VARGPT的技术原理、主要功能、应用场景VARGPT概述简介 VARGPT是创新的多模态大语言大模型,专注于视觉理解和生成任务。基于自回归框架,将视觉生成与理解统一在一个模型中,避免任务切...
-
xAR是什么?一文让你看懂xAR的技术原理、主要功能、应用场景xAR概述简介 xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction...
-
ARTalk是什么?一文让你看懂ARTalk的技术原理、主要功能、应用场景ARTalk概述简介 ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自...
-
ART是什么?一文让你看懂ART的技术原理、主要功能、应用场景ART概述简介 ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直...
-
START是什么?一文让你看懂START的技术原理、主要功能、应用场景START概述简介 START(Self-Taught Reasoner with Tools)是阿里集团和中国科学技术大学推出的新型工具增强型推理...
-
Agent TARS是什么?一文让你看懂Agent TARS的技术原理、主要功能、应用场景Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统...
-
MARS5-TTS是什么?一文让你看懂MARS5-TTS的技术原理、主要功能、应用场景MARS5-TTS概述简介 MARS5-TTS是CAMB.AI推出开源的AI声音克隆工具,有突破性逼真的韵律,支持140多种语言支持。还能处理复杂韵...
-
MARS是什么?一文让你看懂MARS的技术原理、主要功能、应用场景MARS概述简介 MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MA...
-
HART是什么?一文让你看懂HART的技术原理、主要功能、应用场景HART概述简介 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直...
-
LEOPARD是什么?一文让你看懂LEOPARD的技术原理、主要功能、应用场景LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD...
-
CLEAR是什么?一文让你看懂CLEAR的技术原理、主要功能、应用场景CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意...
-
SPAR是什么?一文让你看懂SPAR的技术原理、主要功能、应用场景SPAR概述简介 SPAR是智谱团队推出的自我博弈框架,能增强大型语言大模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成...