功能

首页 > 功能

SmartEraser是什么？一文让你看懂SmartEraser的技术原理、主要功能、应用场景

SmartEraser概述简介 SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术，专门用在从图像中移除用户指定的对象。Sm...
Zerox是什么？一文让你看懂Zerox的技术原理、主要功能、应用场景

Zerox概述简介 Zerox是开源的本地化高精度OCR工具，基于GPT-4o-mini模型，无需提前训练实现零样本识别。Zerox支持PDF、DO...
Video Alchemist是什么？一文让你看懂Video Alchemist的技术原理、主要功能、应用场景

Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型，具备多主体、开放集合个性化能力，能根据...
PSHuman是什么？一文让你看懂PSHuman的技术原理、主要功能、应用场景

PSHuman概述简介 PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型，仅需一张照片，能生成高度逼真的3D人像模型，包括精细...
Wear-Any-Way是什么？一文让你看懂Wear-Any-Way的技术原理、主要功能、应用场景

Wear-Any-Way概述简介 Wear-Any-Way是阿里巴巴拍立淘团队推出的创新的虚拟试穿框架。通过稀疏对应对齐机制，实现了高保真度且可定制...
GameFactory是什么？一文让你看懂GameFactory的技术原理、主要功能、应用场景

GameFactory概述简介 GameFactory 是香港大学和快手科技联合提出的创新框架，解决游戏视频生成中的场景泛化难题。框架基于预训练的视...
Step-2 mini是什么？一文让你看懂Step-2 mini的技术原理、主要功能、应用场景

Step-2 mini概述简介 Step-2 mini 是阶跃星辰推出的轻量级极速大模型，基于新一代自研 Attention 架构 MFA 开发。仅...
FramePainter是什么？一文让你看懂FramePainter的技术原理、主要功能、应用场景

FramePainter概述简介 FramePainter 是基于 AI 的交互式图像编辑工具，通过结合视频扩散模型和直观的草图控制，让用户能通过简...
百聆是什么？一文让你看懂百聆的技术原理、主要功能、应用场景

百聆概述简介百聆(Bailing)是开源的语音对话助手，基于语音识别（ASR）、语音活动检测（VAD）、大语言大模型（LLM）和语音合成（TTS）...
LineArt是什么？一文让你看懂LineArt的技术原理、主要功能、应用场景

LineArt概述简介 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的，无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征...
SynthLight是什么？一文让你看懂SynthLight的技术原理、主要功能、应用场景

SynthLight概述简介 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术，通过模拟不同...
X-Dyna是什么？一文让你看懂X-Dyna的技术原理、主要功能、应用场景

X-Dyna概述简介 X-Dyna 是基于扩散模型的动画生成框架，基于驱动视频中的面部表情和身体动作，将单张人类图像动画化，生成具有真实感和环境感知...
DeepSeek-R1是什么？一文让你看懂DeepSeek-R1的技术原理、主要功能、应用场景

DeepSeek-R1概述简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型，对标OpenAI的o1正式版。...
k1.5是什么？一文让你看懂k1.5的技术原理、主要功能、应用场景

k1.5概述简介 k1.5 是月之暗面Kimi推出的最新多模态思考模型，具备强大的推理和多模态处理能力。模型在 short-CoT（短链思维）模式下...
OmniThink是什么？一文让你看懂OmniThink的技术原理、主要功能、应用场景

OmniThink概述简介 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架，通过模拟人类的迭代扩展和反思过程，突破大型...
H-Optimus-0是什么？一文让你看懂H-Optimus-0的技术原理、主要功能、应用场景

H-Optimus-0概述简介 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数，...
Roop-Unleashed是什么？一文让你看懂Roop-Unleashed的技术原理、主要功能、应用场景

Roop-Unleashed概述简介 Roop-Unleashed 是基于 Roop 的开源项目，专注于深度伪造（Deepfake）技术的实现与优化...
书生·浦像是什么？一文让你看懂书生·浦像的技术原理、主要功能、应用场景

书生·浦像概述简介书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法，核心为浦像HDR（UltraFusion ...
DeepSeek R1-Zero是什么？一文让你看懂DeepSeek R1-Zero的技术原理、主要功能、应用场景

DeepSeek R1-Zero概述简介 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习（RL）训练的推理模型...
VideoWorld是什么？一文让你看懂VideoWorld的技术原理、主要功能、应用场景

VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目，探索深度生成模型是否能仅通过未标...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL