AI工具共5911篇

HumanRig-阿里高德推出的3D人形角色自动绑定任务数据集

HumanRig-阿里高德推出的3D人形角色自动绑定任务数据集-AIGC资源中心
HumanRig是什么 HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑定研究项目。解决现有绑定技术因缺乏高质量数据集而发展受限的问题,通过提供大规模、高质量的数据集和创新的自动绑定框架,推...
AIGC的头像-AIGC资源中心超级会员AIGC26天前
78194

SmartEraser-中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser-中科大与微软亚洲研究院推出的图像对象移除技术-AIGC资源中心
SmartEraser是什么 SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术,专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”(Masked-Region Guidance...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
906116

SHMT-阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SHMT-阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术-AIGC资源中心
SHMT是什么 SHMT(Self-supervised Hierarchical Makeup Transfer)是阿里巴巴达摩院与武汉理工大学等机构联合研发的先进自监督化妆转移技术。技术通过潜在扩散模型实现,能在无需成对训练数据...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
59151

AnyStory-阿里通义推出的高保真个性化文本到图像生成框架

AnyStory-阿里通义推出的高保真个性化文本到图像生成框架-AIGC资源中心
AnyStory是什么 AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架,旨在实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编码阶段,AnyS...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
43667

Uni-AdaFocus-清华大学推出通用的高效视频理解框架

Uni-AdaFocus-清华大学推出通用的高效视频理解框架-AIGC资源中心
Uni-AdaFocus是什么 Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架,框架通过自适应聚焦机制,动态调整计算资源的分配,实现对视频内容的高效处理。具体而言,Uni-Ada...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
88084

T2A-01-HD-海螺AI海外版推出新的语音模型

T2A-01-HD-海螺AI海外版推出新的语音模型-AIGC资源中心
T2A-01-HD是什么 T2A-01-HD是海螺AI海外版推出新的语音模型。支持语音克隆,仅需10秒音频即可精准克隆声音,保留情感底色。模型具备智能情感系统,能捕捉语音中的情感细微差别,使语音更生动。...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
376117

OmAgent-OmAI联合浙大开源的多模态语言代理框架

OmAgent-OmAI联合浙大开源的多模态语言代理框架-AIGC资源中心
OmAgent是什么 OmAgent是Om AI和浙江大学滨江研究院联合开源的多模态语言代理框架,能简化设备端智能代理的开发。OmAgent支持可重用的代理组件,助力开发者构建复杂的多模态代理,处理文本、图...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
346114

SeaweedAPT-字节跳动推出的单步图像和视频生成项目

SeaweedAPT-字节跳动推出的单步图像和视频生成项目-AIGC资源中心
Seaweed APT是什么 Seaweed APT是字节跳动推出的对抗性后训练(Adversarial Post-Training)模型,能实现图像和视频的一站式生成。Seaweed APT基于预训练的扩散模型,直接对真实数据进行对抗性...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
41174

XMusic-腾讯多媒体实验室自主研发的AI通用作曲框架

XMusic-腾讯多媒体实验室自主研发的AI通用作曲框架-AIGC资源中心
XMusic是什么 XMusic是腾讯多媒体实验室自主研发的AI通用作曲框架。用户只需上传视频、图片、文字、标签、哼唱等任意内容,XMusic能生成情绪、曲风、节奏可控的高质量音乐。基于自研的多模态和...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
52489

MatterGen-微软推出的无机材料生成模型

MatterGen-微软推出的无机材料生成模型-AIGC资源中心
MatterGen是什么 MatterGen是微软推出的创新生成模型,专门用在设计无机材料。基于独特的扩散过程,逐步细化原子类型、坐标和周期晶格,生成跨越周期表的稳定、多样化的无机材料。MatterGen能被...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
34394

ParGo-字节与中山大学联合推出的多模态大模型连接器

ParGo-字节与中山大学联合推出的多模态大模型连接器-AIGC资源中心
ParGo是什么 ParGo是字节团队与中山大学合作提出的创新的多模态大语言模型连接器,旨在提升视觉和语言模态在多模态大语言模型(MLLMs)中的对齐效果。通过结合局部token和全局token,使用精心设...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
210104

Weebo-AI语音聊天机器人,实时响应用户语音指令和问题

Weebo-AI语音聊天机器人,实时响应用户语音指令和问题-AIGC资源中心
Weebo是什么 Weebo是实时语音聊天机器人,基于Whisper Small、Llama 3.2和Kokoro-82M技术驱动。能通过语音识别和生成技术,与用户进行自然流畅的对话,提供实时的语音交互体验。Weebo可以应用于...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
75026

Mini-InternVL-上海AILab联合清华等机构推出的轻量级多模态大模型

Mini-InternVL-上海AILab联合清华等机构推出的轻量级多模态大模型-AIGC资源中心
Mini-InternVL是什么 Mini-InternVL是“迷你版”书生·万象大模型,是上海AI实验室与清华大学、南京大学等机构联合推出的轻量级多模态大型语言模型系列,包含1B、2B和4B三个参数版本,用较小的...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
632103

CogVideoX-Flash-智谱推出的首个免费AI视频生成模型

CogVideoX-Flash-智谱推出的首个免费AI视频生成模型-AIGC资源中心
CogVideoX-Flash是什么 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频理解模型,具备强大的视频生成能力。CogVideoX-Flash支持文生视频,依据输入的文本...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
38845

AutoMouser-AIChrome扩展程序,实时交互跟踪自动生成测试代码

AutoMouser-AIChrome扩展程序,实时交互跟踪自动生成测试代码-AIGC资源中心
AutoMouser是什么 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作,如点击、拖动、悬停等,将其转化为结构清晰、...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
968121

MangaNinja-基于参考图像的线稿着色技术

MangaNinja-基于参考图像的线稿着色技术-AIGC资源中心
MangaNinja是什么 MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与图像质量。能应对多样化的上色挑战...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
393126

CogView-3-Flash-智谱推出的首个免费AI图像生成模型

CogView-3-Flash-智谱推出的首个免费AI图像生成模型-AIGC资源中心
CogView-3-Flash 是什么 CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,能根据文本描述生成高审美分数的图像,支持多种分辨率,满足专业领域需求。模型具备创意多样性,基于用户输入生...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
36368

GLM-Realtime-智谱推出的端到端多模态模型

GLM-Realtime-智谱推出的端到端多模态模型-AIGC资源中心
GLM-Realtime是什么 GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容记忆以...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
26951

StepR-mini-阶跃星辰推出的Step系列首个推理模型

StepR-mini-阶跃星辰推出的Step系列首个推理模型-AIGC资源中心
Step R-mini是什么 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长主动规划、尝试和反思,基于慢思考和反复验证的逻辑机制,为用...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
875122

RealtimeSTT-AI实时语音转文本库,自动检测说话的开始与结束

RealtimeSTT-AI实时语音转文本库,自动检测说话的开始与结束-AIGC资源中心
RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCVAD和SileroVAD进行精准检测。同时支持唤醒...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
93955