收集全球10,000⁺个好用的AI软件
-
MuCodec是什么?一文让你看懂MuCodec的技术原理、主要功能、应用场景MuCodec概述简介 MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的开发人员一起推出的超低比特率音乐编解码器,能实现音乐...
-
Find3D是什么?一文让你看懂Find3D的技术原理、主要功能、应用场景Find3D概述简介 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自...
-
Sketch2Lineart是什么?一文让你看懂Sketch2Lineart的技术原理、主要功能、应用场景Sketch2Lineart概述简介 Sketch2Lineart是基于人工智能的绘画工具,能将简单的手绘草图转换成清晰的线条画。通过自动生成草图描...
-
Fancy123是什么?一文让你看懂Fancy123的技术原理、主要功能、应用场景Fancy123概述简介 Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。...
-
Mooncake是什么?一文让你看懂Mooncake的技术原理、主要功能、应用场景Mooncake概述简介 Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过...
-
QwQ-32B-Preview是什么?一文让你看懂QwQ-32B-Preview的技术原理、主要功能、应用场景QwQ-32B-Preview概述简介 QwQ-32B-Preview(QwQ-32B)是阿里推出的开源AI推理模型,在数学和编程领域表现卓越。Qw...
-
InfiMM-WebMath-40B是什么?一文让你看懂InfiMM-WebMath-40B的技术原理、主要功能、应用场景InfiMM-WebMath-40B概述简介 InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多...
-
SAM 2.1是什么?一文让你看懂SAM 2.1的技术原理、主要功能、应用场景SAM 2.1概述简介 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视...
-
Qwen2vl-Flux是什么?一文让你看懂Qwen2vl-Flux的技术原理、主要功能、应用场景Qwen2vl-Flux概述简介 Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参...
-
ShowUI是什么?一文让你看懂ShowUI的技术原理、主要功能、应用场景ShowUI概述简介 ShowUI是新加坡国立大学Show Lab和微软一起推出的视觉-语言-行动模型,能提升图形用户界面(GUI)助手的工作效率。...
-
NVLM是什么?一文让你看懂NVLM的技术原理、主要功能、应用场景NVLM概述简介 NVLM是NVIDIA推出的前沿多模态大型语言大模型(LLMs),在视觉-语言任务上达到与顶尖专有模型(如GPT-4o)和开放访问...
-
Promptriever是什么?一文让你看懂Promptriever的技术原理、主要功能、应用场景Promptriever概述简介 Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型,能像语言大模型一样接受...
-
LongLLaVA是什么?一文让你看懂LongLLaVA的技术原理、主要功能、应用场景LongLLaVA概述简介 LongLLaVA是的多模态大型语言大模型(MLLM),是香港中文大学(深圳)的开发人员推出。基于混合架构,结合Mamb...
-
Devika是什么?一文让你看懂Devika的技术原理、主要功能、应用场景Devika 概述简介 Devika是开源的AI编程工具,能理解并拆分复杂指令,基于集成AI搜索和网页浏览能力搜集信息,编写代码实现目标。Devik...
-
iDP3是什么?一文让你看懂iDP3的技术原理、主要功能、应用场景iDP3概述简介 iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的改进型3D视觉运动策略(如三维扩...
-
Proactive Agent是什么?一文让你看懂Proactive Agent的技术原理、主要功能、应用场景Proactive Agent概述简介 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式 ,具备主动性,...
-
EMOVA是什么?一文让你看懂EMOVA的技术原理、主要功能、应用场景EMOVA概述简介 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、...
-
OminiControl是什么?一文让你看懂OminiControl的技术原理、主要功能、应用场景OminiControl概述简介 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程...
-
Talker-Reasoner是什么?一文让你看懂Talker-Reasoner的技术原理、主要功能、应用场景Talker-Reasoner概述简介 Talker-Reasoner是谷歌DeepMind推出的双思维AI代理架构,借鉴人类的认知理论,将代理分为...
-
Diffusion Self-Distillation是什么?一文让你看懂Diffusion Self-Distillation的技术原理、主要功能、应用场景Diffusion Self-Distillation概述简介 Diffusion Self-Distillation(扩散自蒸馏,简称DSD)是斯...