AI工具-AIGC资源中心-第278页

Fugatto是什么 Fugatto是英伟达（NVIDIA）推出的音频合成和转换模型，全称为”Foundational Generative Audio Transformer Opus 1″。模型能根据文本提示生成音频或视频，接收并修改...

免费资源

AIGC3个月前

45359

LongRAG-智谱联合清华和中科院推出的双视角鲁棒检索框架

LongRAG是什么 LongRAG是清华大学、中国科学院和智谱的研究团队推出的，面向长文本问答（LCQA）的双视角鲁棒检索增强生成（RAG）框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM...

免费资源

AIGC3个月前

840103

Illustrious-开源文本到图像生成模型，专注于生成高质量动漫风格图像

Illustrious是什么 Illustrious是开源的文本到图像动漫图像生成模型，是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法，实现高分辨率、动态色...

免费资源

AIGC3个月前

74978

aisuite-吴恩达发布开源Python库，一个接口调用多个大模型

aisuite是什么 aisuite是开源的Python库，吴恩达（Andrew Ng）发布的，旨在提供一个统一的接口来调用多个大型语言模型（LLM）服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台，开...

免费资源

AIGC3个月前

95683

XGrammar-陈天奇团队推出的LLM结构化生成引擎

XGrammar是什么 XGrammar是由陈天奇团队推出的开源软件库，能为大型语言模型（LLM）提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法（CFG）定义结构，支持递归组合以表示复杂...

免费资源

AIGC3个月前

26540

Edify3D-NVIDIA推出的3D生成模型

Edify 3D是什么 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案，能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构、高分辨率纹理和PBR...

免费资源

AIGC3个月前

87657

SongCreator-AI音乐模型，能理解、生成和编辑歌曲

SongCreator是什么 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型，能从歌词出发生成包含声乐和伴奏的完整歌曲。基于双序列语言模型（DSLM）和注意力掩码策...

免费资源

AIGC3个月前

823126

Teacher2Task-谷歌推出的多教师学习框架

Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架，引入教师特定的输入标记和重新构思训练过程，消除对手动聚合启发式方法的需求。框架不依赖聚合标签，将训练数据转化为N+1个任务...

免费资源

AIGC3个月前

82674

DynaSaur-Adobe推出的大语言模型代理框架

DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型（LLM）代理框架，突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作，基于生成和执行Python代码与...

免费资源

AIGC3个月前

55097

TakinAudioLLM-喜马拉雅推出的系列零样本语音生成模型

Takin AudioLLM是什么 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型，包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术，专注于有声书制...

免费资源

AIGC3个月前

66957

AutoTrain-HuggingFace开源的无代码模型训练平台

AutoTrain是什么 AutoTrain（AutoTrain Advanced）是Hugging Face推出的开源无代码平台，能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署自己的AI模型，只需上传数据即...

免费资源

AIGC3个月前

659122

CAMPHOR-苹果推出的端侧小语言模型多智能体框架

CAMPHOR是什么 CAMPHOR是苹果团队推出的端侧小语言模型（SLM）多智能体框架，能提升移动设备的隐私保护和响应速度。框架基于在设备本地处理多个用户输入并进行个人上下文推理，确保用户隐私安全...

免费资源

AIGC3个月前

19641

ACE-阿里通义实验室推出的全能图像生成和编辑模型

ACE是什么 ACE（All-round Creator and Editor）是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元（LCU）和统一条件格式，能理解和执行自然语...

免费资源

AIGC3个月前

37384

ViewExtrapolator-南洋理工联合UCAS团队推出的新型视图合成方法

ViewExtrapolator是什么 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法，基于稳定视频扩散（Stable Video Diffusion, SVD）的生成先验合成远超出训练视图范围的新视角...

免费资源

AIGC3个月前

31182

OpenScholar-华盛顿大学联合艾伦研究所开源的学术搜索工具

OpenScholar是什么 OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型（LM），能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学论文数据库，用...

免费资源

AIGC3个月前

50823

SmolVLM-HuggingFace推出的轻量级视觉语言模型

SmolVLM是什么 SmolVLM是Hugging Face推出的轻量级视觉语言模型，专为设备端推理设计。以20亿参数量，实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求：SmolVLM-Base：...

免费资源

AIGC3个月前

11629

OneDiffusion-无缝支持双向图像合成和理解的开源扩散模型

OneDiffusion是什么 OneDiffusion是AI2推出的多功能大规模扩散模型，能无缝支持双向图像合成和理解，涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序...

免费资源

AIGC3个月前

27771

LongAlign-港大推出的提升文本到图像扩散模型处理长文本对齐方法

LongAlign是什么 LongAlign是香港大学研究团队推出的文本到图像（T2I）扩散模型的改进方法，能提升长文本输入的对齐精度。LongAlign用段级编码技术，将长文本分割处理，适应编码模型的输入限制...

免费资源

AIGC3个月前

43422

ebook2audiobookXTTS-开源电子书转有声书AI工具，支持16种语言

ebook2audiobookXTTS是什么 ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式，如epub、pdf、mobi等，用Coqui XTTS技术实现高质量的文本到...

免费资源

AIGC3个月前

55050

Optima-清华联合北邮推出优化通信效率和任务有效性的训练框架

Optima是什么 Optima是清华大学推出的优化基于大型语言模型（LLM）的多智能体系统（MAS）的框架。基于一个迭代的生成、排名、选择和训练范式，显著提高通信效率和任务效果。Optima平衡了任务性...

免费资源

AIGC3个月前

91342

上一页 1…276 277278279 280…298 下一页跳转