收集全球10,000⁺个好用的AI软件
-
SmartEraser是什么?一文让你看懂SmartEraser的技术原理、主要功能、应用场景SmartEraser概述简介 SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术,专门用在从图像中移除用户指定的对象。Sm...
-
Zerox是什么?一文让你看懂Zerox的技术原理、主要功能、应用场景Zerox概述简介 Zerox是开源的本地化高精度OCR工具,基于GPT-4o-mini模型,无需提前训练实现零样本识别。Zerox支持PDF、DO...
-
Video Alchemist是什么?一文让你看懂Video Alchemist的技术原理、主要功能、应用场景Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型,具备多主体、开放集合个性化能力,能根据...
-
PSHuman是什么?一文让你看懂PSHuman的技术原理、主要功能、应用场景PSHuman概述简介 PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型,仅需一张照片,能生成高度逼真的3D人像模型,包括精细...
-
Wear-Any-Way是什么?一文让你看懂Wear-Any-Way的技术原理、主要功能、应用场景Wear-Any-Way概述简介 Wear-Any-Way是阿里巴巴拍立淘团队推出的创新的虚拟试穿框架。通过稀疏对应对齐机制,实现了高保真度且可定制...
-
GameFactory是什么?一文让你看懂GameFactory的技术原理、主要功能、应用场景GameFactory概述简介 GameFactory 是香港大学和快手科技联合提出的创新框架,解决游戏视频生成中的场景泛化难题。框架基于预训练的视...
-
Step-2 mini是什么?一文让你看懂Step-2 mini的技术原理、主要功能、应用场景Step-2 mini概述简介 Step-2 mini 是阶跃星辰推出的轻量级极速大模型,基于新一代自研 Attention 架构 MFA 开发。仅...
-
FramePainter是什么?一文让你看懂FramePainter的技术原理、主要功能、应用场景FramePainter概述简介 FramePainter 是基于 AI 的交互式图像编辑工具,通过结合视频扩散模型和直观的草图控制,让用户能通过简...
-
百聆是什么?一文让你看懂百聆的技术原理、主要功能、应用场景百聆概述简介 百聆(Bailing)是开源的语音对话助手,基于语音识别(ASR)、语音活动检测(VAD)、大语言大模型(LLM)和语音合成(TTS)...
-
LineArt是什么?一文让你看懂LineArt的技术原理、主要功能、应用场景LineArt概述简介 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的,无需训练的高质量设计绘图外观迁移框架,能将复杂外观特征...
-
SynthLight是什么?一文让你看懂SynthLight的技术原理、主要功能、应用场景SynthLight概述简介 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术,通过模拟不同...
-
X-Dyna是什么?一文让你看懂X-Dyna的技术原理、主要功能、应用场景X-Dyna概述简介 X-Dyna 是基于扩散模型的动画生成框架,基于驱动视频中的面部表情和身体动作,将单张人类图像动画化,生成具有真实感和环境感知...
-
DeepSeek-R1是什么?一文让你看懂DeepSeek-R1的技术原理、主要功能、应用场景DeepSeek-R1概述简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型,对标OpenAI的o1正式版。...
-
k1.5是什么?一文让你看懂k1.5的技术原理、主要功能、应用场景k1.5概述简介 k1.5 是月之暗面Kimi推出的最新多模态思考模型,具备强大的推理和多模态处理能力。模型在 short-CoT(短链思维)模式下...
-
OmniThink是什么?一文让你看懂OmniThink的技术原理、主要功能、应用场景OmniThink概述简介 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架,通过模拟人类的迭代扩展和反思过程,突破大型...
-
H-Optimus-0是什么?一文让你看懂H-Optimus-0的技术原理、主要功能、应用场景H-Optimus-0概述简介 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数,...
-
Roop-Unleashed是什么?一文让你看懂Roop-Unleashed的技术原理、主要功能、应用场景Roop-Unleashed概述简介 Roop-Unleashed 是基于 Roop 的开源项目,专注于深度伪造(Deepfake)技术的实现与优化...
-
书生·浦像是什么?一文让你看懂书生·浦像的技术原理、主要功能、应用场景书生·浦像概述简介 书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法,核心为浦像HDR(UltraFusion ...
-
DeepSeek R1-Zero是什么?一文让你看懂DeepSeek R1-Zero的技术原理、主要功能、应用场景DeepSeek R1-Zero概述简介 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习(RL)训练的推理模型...
-
VideoWorld是什么?一文让你看懂VideoWorld的技术原理、主要功能、应用场景VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目,探索深度生成模型是否能仅通过未标...