AI工具

FullStackBench-字节豆包联合M-A-P社区开源的全新代码评估基准

FullStackBench-字节豆包联合M-A-P社区开源的全新代码评估基准-AIGC资源中心
FullStack Bench是什么 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈编程和多语言编程能力评估。FullStack Bench覆盖超过11种真实编程场景,包...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
77473

MotionPrompting-谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

MotionPrompting-谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型-AIGC资源中心
Motion Prompting是什么 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术,基于运动轨迹(motion trajectories)控制和引导视频内容的生成。Motion Prompting...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
26737

FishSpeech1.5-FishAudio推出的语音合成模型,支持13种语言

FishSpeech1.5-FishAudio推出的语音合成模型,支持13种语言-AIGC资源中心
Fish Speech 1.5是什么 Fish Speech 1.5 是Fish Audio 推出的文本到语音(TTS)模型,基于深度学习技术如Transformer、VITS、VQVAE和GPT等。Fish Speech 1.5支持英语、日语、韩语、中文等13种语...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
67551

ClearerVoice-Studio-阿里通义实验室开源的语音处理框架

ClearerVoice-Studio-阿里通义实验室开源的语音处理框架-AIGC资源中心
ClearerVoice-Studio是什么 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法,有效消除背景噪声...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
169127

PaliGemma2-谷歌DeepMind推出的全新视觉语言模型

PaliGemma2-谷歌DeepMind推出的全新视觉语言模型-AIGC资源中心
PaliGemma 2是什么 PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型(VLM),作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规模的Gemma 2模型...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
436110

Optimus-1-哈工大联合鹏城实验室推出的智能体框架

Optimus-1-哈工大联合鹏城实验室推出的智能体框架-AIGC资源中心
Optimus-1是什么 Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让智能体更好地执行复杂任务...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
300126

Fox-1-TensorOpera开源的小语言模型系列

Fox-1-TensorOpera开源的小语言模型系列-AIGC资源中心
Fox-1是什么 Fox-1是TensorOpera推出的一系列小型语言模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练,在50亿个指令遵循和多轮对话数...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
33464

Llama3.3-MetaAI推出的纯文本语言模型

Llama3.3-MetaAI推出的纯文本语言模型-AIGC资源中心
Llama 3.3是什么 Llama 3.3是Meta AI推出的70B 参数模型,大型多语言预训练语言模型,性能与40B参数的Llama 3.1相当。模型专为多语言对话优化,支持英语、德语、法语、意大利语、葡萄牙语、印地...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
395114

Aurora-xAI为GrokAI助手推出的新图像生成模型

Aurora-xAI为GrokAI助手推出的新图像生成模型-AIGC资源中心
Aurora是什么 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠)。Aurora 的可用性因用户等级而异...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
63056

OneShotOneTalk-中科大联合香港理工推出的动态图像生成技术

OneShotOneTalk-中科大联合香港理工推出的动态图像生成技术-AIGC资源中心
One Shot, One Talk是什么 One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作。One Sho...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
50550

GLM-4V-Flash-智谱AI推出的首个免费多模态模型API

GLM-4V-Flash-智谱AI推出的首个免费多模态模型API-AIGC资源中心
GLM-4V-Flash是什么 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API,GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等高级图像处理功能,并且...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
167130

clone-voice-开源的声音克隆工具,支持16种语言

clone-voice-开源的声音克隆工具,支持16种语言-AIGC资源中心
clone-voice是什么 Clone-voice是开源的声音克隆工具,基于深度学习技术分析和模拟人类声音,实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在内的16种语言,能将文本转换为语音...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
772109

SNOOPI-AI文本到图像生成框架,提升单步扩散模型的效率和性能

SNOOPI-AI文本到图像生成框架,提升单步扩散模型的效率和性能-AIGC资源中心
SNOOPI是什么 SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导 – SwiftBrush)和NASA(负向远离转向注意力)两种技术。P...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
86190

MEMO-音频驱动的生成肖像说话视频框架,保持身份一致性和表现力

MEMO-音频驱动的生成肖像说话视频框架,保持身份一致性和表现力-AIGC资源中心
MEMO是什么 MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性和表现力的说话视频。MEMO围绕两个...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
22541

NVILA-英伟达推出的视觉语言大模型

NVILA-英伟达推出的视觉语言大模型-AIGC资源中心
NVILA是什么 NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统优化,减少资源消耗,在多...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
19070

O1-CODER-北交大推出的O1代码版开源项目,专注于编码任务

O1-CODER-北交大推出的O1代码版开源项目,专注于编码任务-AIGC资源中心
O1-CODER是什么 O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,提升模型的System-2思维...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
11270

SOLAMI-南洋理工推出的VR端3D角色扮演AI系统

SOLAMI-南洋理工推出的VR端3D角色扮演AI系统-AIGC资源中心
SOLAMI是什么 SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动,基于社交视觉-语言-行为模型,提供超越传统文本和语音...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
632103

Florence-VL-微软和马里兰大学共同开源的多模态大语言模型

Florence-VL-微软和马里兰大学共同开源的多模态大语言模型-AIGC资源中心
Florence-VL是什么 Florence-VL是创新的多模态大型语言模型(MLLMs),是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示,能捕捉图像的不同层次和...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
94221

OOTDiffusion-开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物

OOTDiffusion-开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物-AIGC资源中心
OOTDiffusion是什么 OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模式,用户上传自己的...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
90498

Willow量子芯片-谷歌推出的最强量子芯片,成功解决30年纠错难题

Willow量子芯片-谷歌推出的最强量子芯片,成功解决30年纠错难题-AIGC资源中心
Willow 量子芯片是什么 Willow 量子芯片是谷歌最新推出的具有105个物理量子比特,在量子纠错和计算效率上取得了显著突破。Willow成功解决了量子计算领域近30年的纠错难题,实现了在增加量子比特...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
678102