AI工具

FLOAT-基于流匹配的音频驱动说话人头像生成模型

FLOAT-基于流匹配的音频驱动说话人头像生成模型-AIGC资源中心
FLOAT是什么 FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动设计。模型基于Transformer架构的向...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
33120

SynCamMaster-快手联合浙大、清华等机构推出的多视角视频生成模型

SynCamMaster-快手联合浙大、清华等机构推出的多视角视频生成模型-AIGC资源中心
SynCamMaster是什么 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型,能结合6自由度相机姿势,从任意视点生成开放世界视频。Sy...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
231101

STIV-苹果公司推出的视频生成大模型

STIV-苹果公司推出的视频生成大模型-AIGC资源中心
STIV是什么 STIV(Scalable Text and Image Conditioned Video Generation)是苹果公司推出的视频生成大模型。STIV拥有8.7亿参数,能处理文本到视频(T2V)和文本图像到视频(TI2V)任务,基于...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
40692

DiffSensei-AI漫画生成框架,能生成可控的黑白漫画面板

DiffSensei-AI漫画生成框架,能生成可控的黑白漫画面板-AIGC资源中心
DiffSensei是什么 DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架,能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生成器和多模态大型语言模型...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
58045

Maya-开源多语言多模态模型,能处理和理解八种不同语言

Maya-开源多语言多模态模型,能处理和理解八种不同语言-AIGC资源中心
Maya是什么 Maya是开源的多语言多模态模型,基于指令微调扩展模型在多种语言和文化背景下的能力。Maya基于LLaVA框架,包含新创建的包含八种语言的预训练数据集,提高视觉-语言任务中的文化和语...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
418127

千影QianYing-巨人网络推出的有声游戏生成大模型

千影QianYing-巨人网络推出的有声游戏生成大模型-AIGC资源中心
千影 QianYing是什么 千影 QianYing是巨人网络推出的有声游戏生成大模型,包含游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame面向开放世界游戏,是巨人网络AI Lab与清华大学SA...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
53983

Promptic-轻量级LLM应用开发框架,通过一行代码切换不同LLM

Promptic-轻量级LLM应用开发框架,通过一行代码切换不同LLM-AIGC资源中心
Promptic是什么 Promptic是轻量级的LLM应用开发框架,提供高效且符合Python风格的开发方式。基于LiteLLM,Promptic支持开发者能轻松切换不同的LLM服务提供商,只需更改一行代码。Promptic支持流...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
14158

SwiftEdit-AI文本引导图像编辑框架,0.23秒内实现高质量的图像编辑

SwiftEdit-AI文本引导图像编辑框架,0.23秒内实现高质量的图像编辑-AIGC资源中心
SwiftEdit是什么 SwiftEdit是VinAI Research团队推出的文本引导的图像编辑框架,基于创新的一步扩散技术,能在0.23秒内实现快速且高质量的图像编辑。工具的核心优势在于一步反演框架和掩码引导...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
24871

ChatMCP-AI聊天客户端,基于MCP支持多语言和自动化安装

ChatMCP-AI聊天客户端,基于MCP支持多语言和自动化安装-AIGC资源中心
ChatMCP是什么 ChatMCP 是基于模型上下文协议(MCP)的 AI 聊天客户端,支持与各种大型语言模型(LLM)如 OpenAI、Claude 和 OLLama 等进行交互。ChatMCP具备自动化安装 MCP 服务器、SSE 传输支...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
11144

MultimodalLiveAPI-谷歌推出支持多模态交互、低延迟实时互动的AI接口

MultimodalLiveAPI-谷歌推出支持多模态交互、低延迟实时互动的AI接口-AIGC资源中心
Multimodal Live API是什么 Multimodal Live API 是谷歌推出的低延迟、双向交互的AI接口,支持文本、音频和视频输入,用音频和文本形式输出,能帮助开发者构建具有实时音频和视频流功能的应用程...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
21734

CodeArena-用于测试不同LLM编程能力的在线平台

CodeArena-用于测试不同LLM编程能力的在线平台-AIGC资源中心
CodeArena是什么 CodeArena是在线平台,基于让多个大型语言模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成代码的能力。CodeArena平台主要评估和比较不同LLM的代码生成能力...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
78931

Phi-4-微软开源的14B参数小语言模型,擅长数学等领域的复杂推理

Phi-4-微软开源的14B参数小语言模型,擅长数学等领域的复杂推理-AIGC资源中心
Phi-4是什么 Phi-4是微软推出的14B参数小型语言模型,在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点,大量融入合成数据,提升模型在STEM问答和数学竞赛...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
13124

Insight-V-提升长链视觉推理能力的多模态模型

Insight-V-提升长链视觉推理能力的多模态模型-AIGC资源中心
Insight-V是什么 Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流程生产高质量的推...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
250119

SVDQuant-MIT推出的扩散模型后训练量化技术

SVDQuant-MIT推出的扩散模型后训练量化技术-AIGC资源中心
SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中的异常值...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
86547

MetaMotivo-Meta推出控制数字智能体动作的人工智能模型

MetaMotivo-Meta推出控制数字智能体动作的人工智能模型-AIGC资源中心
Meta Motivo是什么 Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。模型采用无监督强化学习算...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
82493

Step-1o-阶跃星辰推出的国内首个千亿参数端到端语音大模型

Step-1o-阶跃星辰推出的国内首个千亿参数端到端语音大模型-AIGC资源中心
Step-1o是什么 Step-1o是阶跃星辰推出的国内首个千亿参数端到端语音大模型。模型支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,提供最便捷的互动体验;同时还可以通过自学和...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
284105

360gpt2-o1-360推出国产自研AI大模型,多项评测优于GPT-4o

360gpt2-o1-360推出国产自研AI大模型,多项评测优于GPT-4o-AIGC资源中心
360gpt2-o1是什么 360gpt2-o1是 360 自研的 AI 大模型,在推理能力上有显著提升,特别是在数学和逻辑推理任务上表现出色。模型通过合成数据优化、模型后训练和“慢思考”范式实现了技术突破,在...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
308119

POINTS1.5-腾讯微信推出的多模态大模型

POINTS1.5-腾讯微信推出的多模态大模型-AIGC资源中心
POINTS 1.5是什么 POINTS 1.5 是腾讯微信发布的多模态大模型,是POINTS 1.0的升级版本。 模型继续沿用了POINTS 1.0中的LLaVA架构,由一个视觉编码器、一个投影器和一个大型语言模型组成。 POINT...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
28952

k1视觉思考模型-kimi推出的k1系列强化学习模型

k1视觉思考模型-kimi推出的k1系列强化学习模型-AIGC资源中心
k1 视觉思考模型是什么 k1 视觉思考模型是kimi推出的k1系列强化学习AI模型,原生支持端到端图像理解和思维链技术,将能力扩展到数学之外的更多基础科学领域。k1模型在图像理解、数学、物理、化...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
59838

FreeScale-无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像

FreeScale-无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像-AIGC资源中心
FreeScale是什么 FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和融合不同尺度的信息,有效解...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
140108