AI工具-AIGC资源中心-第283页

GenMAC-港大、清华联合微软推出文本到视频生成的多代理协作框架

GenMAC-港大、清华联合微软推出文本到视频生成的多代理协作框架-AIGC资源中心

GenMAC是什么 GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架，用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计三个阶段，在生成与重...

AIGC3个月前

26876

Amurex-开源AI会议助手，提供实时建议、智能摘要、快速回顾关键信息

Amurex-开源AI会议助手，提供实时建议、智能摘要、快速回顾关键信息-AIGC资源中心

Amurex是什么 Amurex是AI会议助手，基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能，帮助用户提升会议效率。作为开源工具，Amurex强调透明度、安全性和隐私保护，让...

AIGC3个月前

43592

易健EasyHealth-北大健康推出的AI健康科普应用

易健EasyHealth-北大健康推出的AI健康科普应用-AIGC资源中心

易健EasyHealth是什么易健EasyHealth是北京大学健康传播专业师生推出的微信小程序，基于大语言模型技术打造的健康科普智能问答系统。程序提供AI智能问答、情感智能算法、健康档案管理、健康数...

AIGC3个月前

50225

See3D-智源研究院开源的无标注视频学习3D生成模型

See3D-智源研究院开源的无标注视频学习3D生成模型-AIGC资源中心

See3D是什么 See3D（See Video, Get 3D）是北京智源人工智能研究院推出的3D生成模型，能基于大规模无标注的互联网视频进行学习，实现从视频中生成3D内容。与传统依赖相机参数的3D生成模型不同，...

AIGC3个月前

79164

VISIONXL-AI视频修复处理工具，修复缺失、支持四倍超分辨率

VISIONXL-AI视频修复处理工具，修复缺失、支持四倍超分辨率-AIGC资源中心

VISION XL是什么 VISION XL是高效的视频修复和超分辨率工具，基于潜在扩散模型技术，专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊，提升视频清晰度，最高可达四倍超分辨率。V...

AIGC3个月前

85066

SPDL-MetaAI推出的开源高性能AI模型数据加载解决方案

SPDL-MetaAI推出的开源高性能AI模型数据加载解决方案-AIGC资源中心

SPDL是什么 SPDL（Scalable and Performant Data Loading）是 Meta AI 推出的开源数据加载工具，能提高 AI 模型训练效率。基于多线程技术，实现高吞吐量数据加载，减少计算资源消耗。与传统基于...

AIGC3个月前

80145

CausVid-Adobe联合MIT推出的自回归实时视频生成技术

CausVid-Adobe联合MIT推出的自回归实时视频生成技术-AIGC资源中心

CausVid是什么 CausVid是Adobe和MIT共同推出的自回归实时视频生成技术，能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型，减少视频生成的延迟，首帧延迟仅1.3秒，生成...

AIGC3个月前

309105

ClotheDreamer-上海大学联合腾讯等高校推出的3D服装生成技术

ClotheDreamer-上海大学联合腾讯等高校推出的3D服装生成技术-AIGC资源中心

ClotheDreamer是什么 ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术，能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreamer用3D高斯为基...

AIGC3个月前

176107

Director-构建视频智能体AI框架，用自然语言执行搜索、总结等复杂视频任务

Director-构建视频智能体AI框架，用自然语言执行搜索、总结等复杂视频任务-AIGC资源中心

Director是什么 Director是构建视频智能体的框架，用户能用自然语言命令执行复杂的视频任务，如视频搜索、编辑、合成和生成，能即时流式传输结果。基于VideoDB的“视频即数据”基础设施，Direct...

AIGC3个月前

59562

DeepSeek-V2.5-1210-DeepSeekV2.5的最终版微调模型，支持联网搜索

DeepSeek-V2.5-1210-DeepSeekV2.5的最终版微调模型，支持联网搜索-AIGC资源中心

DeepSeek-V2.5-1210是什么 DeepSeek-V2.5-1210是 DeepSeek 推出的 DeepSeek V2 系列收官AI模型，DeepSeek V2.5 的最终版微调模型。模型基于Post-Training迭代，在数学、编程、写作和角色扮演等...

AIGC3个月前

557101

EXAONE3.5-LG推出的开源AI模型，擅长长文本处理降低模型幻觉问题

EXAONE3.5-LG推出的开源AI模型，擅长长文本处理降低模型幻觉问题-AIGC资源中心

EXAONE 3.5是什么 EXAONE 3.5是LG AI研究院推出的开源AI模型，包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理，在基准测试中表现优异，特别是在实际应用、长文本处理和数学方...

AIGC3个月前

96464

DrivingDojo-中科院联合美团推出的交互式驾驶世界模型数据集

DrivingDojo-中科院联合美团推出的交互式驾驶世界模型数据集-AIGC资源中心

DrivingDojo是什么 DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集，用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段，覆盖完整的驾驶操作、...

AIGC3个月前

34464

FineWeb2-HuggingFace推出的多语言预训练数据集

FineWeb2-HuggingFace推出的多语言预训练数据集-AIGC资源中心

FineWeb 2是什么 FineWeb 2是Hugging Face推出的多语言预训练数据集，覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理，包括语言识别、去重、内容过滤和PII匿名化，适应不同语言的特点...

AIGC3个月前

18361

Gemini2.0-谷歌推出的原生多模态输入输出+Agent为核心的AI模型

Gemini2.0-谷歌推出的原生多模态输入输出+Agent为核心的AI模型-AIGC资源中心

Gemini 2.0是什么 Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型，以多模态输入输出和Agent技术为核心，速度比 1.5 Pro快两倍，关键性能指标超...

AIGC3个月前

73861

书生·万象InternVL2.5-上海AILab开源的多模态大语言模型系列

书生·万象InternVL2.5-上海AILab开源的多模态大语言模型系列-AIGC资源中心

书生·万象InternVL 2.5是什么书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型（MLLM）系列。该系列模型在InternVL 2.0的基础上进行显著增强，特别是在训练...

AIGC3个月前

92675

ChatTTSPlus-开源文本转语音工具，ChatTTS扩展版支持语音克隆

ChatTTSPlus-开源文本转语音工具，ChatTTS扩展版支持语音克隆-AIGC资源中心

ChatTTSPlus是什么 ChatTTSPlus是ChatTTS的扩展版本，增加了TensorRT加速、语音克隆和移动模型部署等功能，提升语音合成的性能和灵活性。在Windows平台上，实现了超过3倍的加速，从28 tokens/s...

AIGC3个月前

85524

MMAudio-基于多模态联合训练实现高质量AI音频合成项目

MMAudio-基于多模态联合训练实现高质量AI音频合成项目-AIGC资源中心

MMAudio是什么 MMAudio是先进视频到音频合成技术，基于多模态联合训练，让模型能在广泛的视听和音频文本数据集上进行训练。技术的核心是同步模块，确保生成的音频与视频帧精确匹配，实现高度同...

AIGC3个月前

5557

Ultravox-端到端多模态大模型，直接理解文本和人类语音

Ultravox-端到端多模态大模型，直接理解文本和人类语音-AIGC资源中心

Ultravox是什么 Ultravox是新型的多模态大型语言模型（LLM），能直接理解文本和人类语音，无需依赖单独的自动语音识别（ASR）阶段。基于多模态投影器技术将音频数据转换为高维空间表示，与LLM直...

AIGC3个月前

56895

ProjectMariner-谷歌推出的浏览网站智能体，能帮用户操作表格、在线购物

ProjectMariner-谷歌推出的浏览网站智能体，能帮用户操作表格、在线购物-AIGC资源中心

Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术，用 Chrome 扩展程序实现浏览器自动化，理解和执行网页任务。Project Mariner...

AIGC3个月前

432123

TENAgent-开源的实时多模态AI代理框架

TENAgent-开源的实时多模态AI代理框架-AIGC资源中心

TEN Agent是什么 TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agent能实现语音、文本、图像的多模态交互，具备天气查询、网络搜索、视觉识别、RAG能力，支持...

AIGC3个月前

63460

上一页 1…281 282283284 285…298 下一页跳转