AI工具

Sky-T1-NovaSky开源的推理AI模型,可从零开始复现该模型

Sky-T1-NovaSky开源的推理AI模型,可从零开始复现该模型-AIGC资源中心
Sky-T1是什么 Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均已公开,用户可以从零...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
898121

FaceLift-Adobe联合加州大学推出的单张图像到3D头部模型生成技术

FaceLift-Adobe联合加州大学推出的单张图像到3D头部模型生成技术-AIGC资源中心
FaceLift是什么 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的头部模型。FaceLift基于两阶段的流程实现:基于扩散的多视图生成...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
597100

SVFR-腾讯优图联合厦门大学推出的通用视频人脸修复统一框架

SVFR-腾讯优图联合厦门大学推出的通用视频人脸修复统一框架-AIGC资源中心
SVFR是什么 SVFR(Stable Video Face Restoration)是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统一框架,整合了视频人脸修复(BFR)、着色和修复任务,基于Stable Video Diff...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
34342

TimesFM2.0-谷歌研究团队开源的时间序列预测模型

TimesFM2.0-谷歌研究团队开源的时间序列预测模型-AIGC资源中心
TimesFM 2.0是什么 TimesFM 2.0是谷歌研究团队推出的开源时间序列预测模型。具备强大的预测能力,可处理长达2048个时间点的单变量时间序列,支持任意预测时间跨度。模型采用仅解码器架构,结合...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
105130

NeuralSVG-文本驱动矢量图形生成技术,转化为有层次结构的矢量图形

NeuralSVG-文本驱动矢量图形生成技术,转化为有层次结构的矢量图形-AIGC资源中心
NeuralSVG是什么 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络,将文本提示转化为具有层次结构的矢量图形。该网络以形状索引为输入,输出形状参数,再经可微渲染...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
539113

ViTPose-基于Transformer架构的人体姿态估计模型

ViTPose-基于Transformer架构的人体姿态估计模型-AIGC资源中心
ViTPose是什么 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通过将输入图像切块并送入 Transformer block 来提取特征,再经解码器将特征解码为...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
207105

Nemotron-CC-英伟达推出的大型预训练数据集

Nemotron-CC-英伟达推出的大型预训练数据集-AIGC资源中心
Nemotron-CC是什么 Nemotron-CC是NVIDIA团队推出的大型预训练数据集,能将Common Crawl数据转化为适用于长序列预训练的高质量语料。Nemotron-CC数据集结合分类器集成、合成数据重述和减少启发式...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
573125

NVIDIA-Ingest-英伟达开源的智能文档提取及结构化工具

NVIDIA-Ingest-英伟达开源的智能文档提取及结构化工具-AIGC资源中心
NVIDIA-Ingest是什么 NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDIA-Ingest能将文档转换为元数据和文本,便于嵌入到检索系统中。NVIDIA-Inge...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
6689

Eko-FellouAI推出的开源AI代理开发框架

Eko-FellouAI推出的开源AI代理开发框架-AIGC资源中心
Eko是什么 Eko是Fellou AI推出的生产就绪型JavaScript框架,基于自然语言驱动的方式,帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台,包括计算机桌面环境和浏览器环...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
156109

Emotion-LLaMA-多模态情绪识别与推理模型,融合音频、视觉和文本输入

Emotion-LLaMA-多模态情绪识别与推理模型,融合音频、视觉和文本输入-AIGC资源中心
Emotion-LLaMA是什么 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模型基于修改版LLaMA,经指令调整以提升情感识别能力。研究者构建了...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
184125

GR00T-Teleop-英伟达发布通过AppleVisionPro捕捉人类动作的技术

GR00T-Teleop-英伟达发布通过AppleVisionPro捕捉人类动作的技术-AIGC资源中心
GR00T-Teleop是什么 GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVIDIA CloudXR连接Apple Vision Pro头显,用专门设计的人形远程操作自定义CloudXR运行时...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
15647

MiniRAG-港大推出高效部署小语言模型的新型RAG系统

MiniRAG-港大推出高效部署小语言模型的新型RAG系统-AIGC资源中心
MiniRAG是什么 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感知的异构...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
40043

Riona-AI-Agent-AI社交工具,可在社交媒体平台自动化交互点赞评论

Riona-AI-Agent-AI社交工具,可在社交媒体平台自动化交互点赞评论-AIGC资源中心
Riona-AI-Agent是什么 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 Instagram、Twitter 和 GitHub 等社交媒体平台进行交互。Riona-AI-Agent能生成引人入胜的内容...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
76672

Prometheus-浙大联合蚂蚁等高校推出的3D感知潜在扩散模型

Prometheus-浙大联合蚂蚁等高校推出的3D感知潜在扩散模型-AIGC资源中心
Prometheus是什么 Prometheus是创新的3D感知潜在扩散模型,专门用于快速生成文本到3D场景的内容。能在几秒钟内完成对象和场景级别的3D生成,同时保持高质量的输出和良好的泛化能力。核心在于基...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
724110

MinMo-阿里通义实验室推出的多模态语音交互大模型

MinMo-阿里通义实验室推出的多模态语音交互大模型-AIGC资源中心
MinMo是什么 MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型,专注于实现无缝语音交互。MinMo拥有约80亿参数,基于多阶段训练,在140万小时多样化语音数据和广泛语音任务上进行学...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
53640

MiniMax-01-MiniMax开源的全新系列模型

MiniMax-01-MiniMax开源的全新系列模型-AIGC资源中心
MiniMax-01是什么 MiniMax-01是MiniMax推出的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01首次大规模实现线性注意力机制,打破传统Transforme...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
24091

讯飞星火X1-科大讯飞推出的深度推理模型

讯飞星火X1-科大讯飞推出的深度推理模型-AIGC资源中心
讯飞星火 X1是什么 讯飞星火 X1 是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题过程中更接近人类的“慢思考”方式,仅用更少的算力...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
750122

星火语音同传大模型-科大讯飞推出的端到端语音同传大模型

星火语音同传大模型-科大讯飞推出的端到端语音同传大模型-AIGC资源中心
星火语音同传大模型是什么 星火语音同传大模型是科大讯飞于2025年1月15日发布的国内首个具备端到端语音同传能力的大模型。模型在内容完整度、信息准确度以及语言质量上均处于行业领先水平,超过...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
328111

Titans-谷歌推出的新型神经记忆架构

Titans-谷歌推出的新型神经记忆架构-AIGC资源中心
Titans是什么 Titans是谷歌推出的新型神经网络架构,能突破Transformer在处理长序列数据时的记忆瓶颈。Titans引入神经长期记忆模块,模拟人脑记忆机制,强化对意外事件的记忆能力。Titans架构包...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
64589

moonshot-v1-vision-preview-月之暗面推出的多模态图片理解模型

moonshot-v1-vision-preview-月之暗面推出的多模态图片理解模型-AIGC资源中心
moonshot-v1-vision-preview是什么 moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模态能力,具备强大的图像识别能力,能精准区分复杂...
AIGC的头像-AIGC资源中心超级会员AIGC3个月前
87995