收集全球10,000⁺个好用的AI软件
-
RWKV-7是什么?一文让你看懂RWKV-7的技术原理、主要功能、应用场景RWKV-7概述简介 RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵...
-
PromptWizard是什么?一文让你看懂PromptWizard的技术原理、主要功能、应用场景PromptWizard PromptWizard是微软推出的自动化提示优化框架,改进大型语言大模型(LLMs)在特定任务中的表现。基于自我演变和自...
-
INFP是什么?一文让你看懂INFP的技术原理、主要功能、应用场景INFP概述简介 INFP是音频驱动的头部生成框架,专为双人对话交互设计。能自动在对话音频引导下进行角色的转换,无需手动分配角色和角色切换。INFP...
-
VisionFM是什么?一文让你看懂VisionFM的技术原理、主要功能、应用场景VisionFM概述简介 VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,4...
-
MetaMorph是什么?一文让你看懂MetaMorph的技术原理、主要功能、应用场景MetaMorph概述简介 MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它...
-
AgentScope是什么?一文让你看懂AgentScope的技术原理、主要功能、应用场景AgentScope概述简介 AgentScope是阿里集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高...
-
LeviTor是什么?一文让你看懂LeviTor的技术原理、主要功能、应用场景LeviTor概述简介 LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术,结合深度信息和K-means聚类点控制视频中3D...
-
3D-Speaker是什么?一文让你看懂3D-Speaker的技术原理、主要功能、应用场景3D-Speaker概述简介 3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目,基于结合声学、语义、视觉信息,实现高精度的说话人...
-
ERA-42是什么?一文让你看懂ERA-42的技术原理、主要功能、应用场景ERA-42概述简介 ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任...
-
Baichuan4-Finance是什么?一文让你看懂Baichuan4-Finance的技术原理、主要功能、应用场景Baichuan4-Finance概述简介 Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型,包括Baichuan4-Fi...
-
VSI-Bench是什么?一文让你看懂VSI-Bench的技术原理、主要功能、应用场景VSI-Bench概述简介 VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飞飞、谢赛宁及他们的...
-
Bamba-9B是什么?一文让你看懂Bamba-9B的技术原理、主要功能、应用场景Bamba-9B概述简介 Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言大...
-
Univer是什么?一文让你看懂Univer的技术原理、主要功能、应用场景Univer概述简介 Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器...
-
Kheish是什么?一文让你看懂Kheish的技术原理、主要功能、应用场景Kheish概述简介 Kheish是基于大型语言大模型(LLM)的多智能体编排开源平台,用多个专门的角色(智能体)和灵活的工作流协调复杂任务的各个步...
-
HelloMeme是什么?一文让你看懂HelloMeme的技术原理、主要功能、应用场景HelloMeme概述简介 HelloMeme是基于最新的Diffusion生成技术的框架,实现表情与姿态的迁移,HelloMeme集成空间编织注意...
-
InvSR是什么?一文让你看懂InvSR的技术原理、主要功能、应用场景InvSR概述简介 InvSR是创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。用大型预训练扩散模型中丰富的图像先验,改善超分辨率的效...
-
CLEAR是什么?一文让你看懂CLEAR的技术原理、主要功能、应用场景CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意...
-
DisPose是什么?一文让你看懂DisPose的技术原理、主要功能、应用场景DisPose概述简介 DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队一起推出的,提高人物图像动画质量的控制技术,基于...
-
OCTAVE是什么?一文让你看懂OCTAVE的技术原理、主要功能、应用场景OCTAVE 概述简介 OCTAVE(Omni-Capable Text and Voice Engine)是Hume AI推出的新一代语音语言大模...
-
Granite 3.1是什么?一文让你看懂Granite 3.1的技术原理、主要功能、应用场景Granite 3.1概述简介 Granite 3.1是IBM推出的新一代语言大模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模...