AI工具

Fugatto-英伟达推出的多功能AI音频生成模型

Fugatto-英伟达推出的多功能AI音频生成模型-AIGC资源中心
Fugatto是什么 Fugatto是英伟达(NVIDIA)推出的音频合成和转换模型,全称为”Foundational Generative Audio Transformer Opus 1″。模型能根据文本提示生成音频或视频,接收并修改...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
45359

LongRAG-智谱联合清华和中科院推出的双视角鲁棒检索框架

LongRAG-智谱联合清华和中科院推出的双视角鲁棒检索框架-AIGC资源中心
LongRAG是什么 LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
840103

Illustrious-开源文本到图像生成模型,专注于生成高质量动漫风格图像

Illustrious-开源文本到图像生成模型,专注于生成高质量动漫风格图像-AIGC资源中心
Illustrious是什么 Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高分辨率、动态色...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
74978

aisuite-吴恩达发布开源Python库,一个接口调用多个大模型

aisuite-吴恩达发布开源Python库,一个接口调用多个大模型-AIGC资源中心
aisuite是什么 aisuite是开源的Python库,吴恩达(Andrew Ng)发布的,旨在提供一个统一的接口来调用多个大型语言模型(LLM)服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台,开...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
95683

XGrammar-陈天奇团队推出的LLM结构化生成引擎

XGrammar-陈天奇团队推出的LLM结构化生成引擎-AIGC资源中心
XGrammar是什么 XGrammar是由陈天奇团队推出的开源软件库,能为大型语言模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法(CFG)定义结构,支持递归组合以表示复杂...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
26540

Edify3D-NVIDIA推出的3D生成模型

Edify3D-NVIDIA推出的3D生成模型-AIGC资源中心
Edify 3D是什么 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构、高分辨率纹理和PBR...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
87657

SongCreator-AI音乐模型,能理解、生成和编辑歌曲

SongCreator-AI音乐模型,能理解、生成和编辑歌曲-AIGC资源中心
SongCreator是什么 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型,能从歌词出发生成包含声乐和伴奏的完整歌曲。基于双序列语言模型(DSLM)和注意力掩码策...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
823126

Teacher2Task-谷歌推出的多教师学习框架

Teacher2Task-谷歌推出的多教师学习框架-AIGC资源中心
Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N+1个任务...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
82674

DynaSaur-Adobe推出的大语言模型代理框架

DynaSaur-Adobe推出的大语言模型代理框架-AIGC资源中心
DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和执行Python代码与...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
55097

TakinAudioLLM-喜马拉雅推出的系列零样本语音生成模型

TakinAudioLLM-喜马拉雅推出的系列零样本语音生成模型-AIGC资源中心
Takin AudioLLM是什么 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术,专注于有声书制...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
66957

AutoTrain-HuggingFace开源的无代码模型训练平台

AutoTrain-HuggingFace开源的无代码模型训练平台-AIGC资源中心
AutoTrain是什么 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署自己的AI模型,只需上传数据即...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
659122

CAMPHOR-苹果推出的端侧小语言模型多智能体框架

CAMPHOR-苹果推出的端侧小语言模型多智能体框架-AIGC资源中心
CAMPHOR是什么 CAMPHOR是苹果团队推出的端侧小语言模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地处理多个用户输入并进行个人上下文推理,确保用户隐私安全...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
19641

ACE-阿里通义实验室推出的全能图像生成和编辑模型

ACE-阿里通义实验室推出的全能图像生成和编辑模型-AIGC资源中心
ACE是什么 ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格式,能理解和执行自然语...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
37384

ViewExtrapolator-南洋理工联合UCAS团队推出的新型视图合成方法

ViewExtrapolator-南洋理工联合UCAS团队推出的新型视图合成方法-AIGC资源中心
ViewExtrapolator是什么 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SVD)的生成先验合成远超出训练视图范围的新视角...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
31182

OpenScholar-华盛顿大学联合艾伦研究所开源的学术搜索工具

OpenScholar-华盛顿大学联合艾伦研究所开源的学术搜索工具-AIGC资源中心
OpenScholar是什么 OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型(LM),能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学论文数据库,用...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
50823

SmolVLM-HuggingFace推出的轻量级视觉语言模型

SmolVLM-HuggingFace推出的轻量级视觉语言模型-AIGC资源中心
SmolVLM是什么 SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求:SmolVLM-Base:...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
11629

OneDiffusion-无缝支持双向图像合成和理解的开源扩散模型

OneDiffusion-无缝支持双向图像合成和理解的开源扩散模型-AIGC资源中心
OneDiffusion是什么 OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
27771

LongAlign-港大推出的提升文本到图像扩散模型处理长文本对齐方法

LongAlign-港大推出的提升文本到图像扩散模型处理长文本对齐方法-AIGC资源中心
LongAlign是什么 LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编码模型的输入限制...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
43422

ebook2audiobookXTTS-开源电子书转有声书AI工具,支持16种语言

ebook2audiobookXTTS-开源电子书转有声书AI工具,支持16种语言-AIGC资源中心
ebook2audiobookXTTS是什么 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现高质量的文本到...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
55050

Optima-清华联合北邮推出优化通信效率和任务有效性的训练框架

Optima-清华联合北邮推出优化通信效率和任务有效性的训练框架-AIGC资源中心
Optima是什么 Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果。Optima平衡了任务性...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
91342