首页
赚钱项目
引流推广
文案写作解说
社群营销
网创项目
AIGC技术
图片技术
视频创作
综合技术
源码中心
小程序
编程源码
网页源码
软件资源
直播必备
常用软件
设计办公
模型插件
技术教程
素材资源
视频素材
设计素材
商用字体
音效资源
发布
发布文章
创建话题
创建版块
发布帖子
开通会员
开通黄金会员
全站资源折扣购买
部分内容免费阅读
开通黄金会员
开通超级会员
99%资源免费下载
99%内容免费阅读
一对一技术指导
VIP用户专属QQ群
开通超级会员
登录
注册
首页
赚钱项目
引流推广
文案写作解说
社群营销
网创项目
AIGC技术
图片技术
视频创作
综合技术
源码中心
小程序
编程源码
网页源码
软件资源
直播必备
常用软件
设计办公
模型插件
技术教程
素材资源
视频素材
设计素材
商用字体
音效资源
开通会员 尊享会员权益
登录
注册
找回密码
快速登录
AI工具
排序
更新
浏览
点赞
评论
MuCodec-清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
MuCodec是什么 MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的研究人员共同推出的超低比特率音乐编解码器,能实现音乐的高效压缩与高保真重建。MuCodec基于MuEncoder提取音...
免费资源
AIGC
3个月前
762
22
Find3D-加州理工学院推出的3D部件分割模型
Find3D是什么 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据,并用对比训练方法训练...
免费资源
AIGC
3个月前
982
112
Sketch2Lineart-AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是什么 Sketch2Lineart是基于人工智能的绘画工具,能将简单的手绘草图转换成清晰的线条画。通过自动生成草图描述并据此绘制线条画,支持调整细节适应不同风格。用户只需上传草图...
免费资源
AIGC
3个月前
561
129
Fancy123-华中科技和华南理工推出的3D网格生成技术
Fancy123是什么 Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作,分别解决多视图图像...
免费资源
AIGC
3个月前
205
50
Mooncake-月之暗面Kimi联合清华等机构推出的大模型推理架构
Mooncake是什么 Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充分利用的CPU、DRAM和...
免费资源
AIGC
3个月前
794
110
QwQ-32B-Preview-阿里开源的AI推理模型,基准测试超越o1模型
QwQ-32B-Preview是什么 QwQ-32B-Preview(QwQ-32B)是阿里推出的开源AI推理模型,在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处理长达32000个tokens的提示词。在多个基准测试...
免费资源
AIGC
3个月前
651
107
InfiMM-WebMath-40B-字节联合中科院开源的超大规模多模态数据集
InfiMM-WebMath-40B是什么 InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Common Crawl 中提取,经...
免费资源
AIGC
3个月前
970
36
SAM2.1-Meta开源的视觉分割模型
SAM 2.1是什么 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设计,实现实时视频处理。...
免费资源
AIGC
3个月前
762
24
Qwen2vl-Flux-开源的多模态图像生成模型,支持多种生成模式
Qwen2vl-Flux是什么 Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换...
免费资源
AIGC
3个月前
895
97
ShowUI-新加坡国立联合微软推出用于GUI自动化的视觉-语言-操作模型
ShowUI是什么 ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型,能提升图形用户界面(GUI)助手的工作效率。模型基于UI引导的视觉令牌选择减少计算成本,用交错视觉-语言-行...
免费资源
AIGC
3个月前
720
52
NVLM-英伟达推出的多模态大型语言模型
NVLM是什么 NVLM是NVIDIA推出的前沿多模态大型语言模型(LLMs),在视觉-语言任务上达到与顶尖专有模型(如GPT-4o)和开放访问模型(如Llama 3-V 405B和InternVL 2)相匹敌的性能。NVLM 1.0家族...
免费资源
AIGC
3个月前
382
33
Promptriever-信息检索模型,支持自然语言提示响应用户搜索需求
Promptriever是什么 Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型,能像语言模型一样接受自然语言提示,用直观的方式响应用户的搜索需求。Promptriever 基于 MS MARC...
免费资源
AIGC
3个月前
811
70
LongLLaVA-香港中文大学推出的多模态上下文混合架构大语言模型
LongLLaVA是什么 LongLLaVA是的多模态大型语言模型(MLLM),是香港中文大学(深圳)的研究人员推出。基于混合架构,结合Mamba和Transformer模块,提高处理大量图像数据的效率。LongLLaVA能在单...
免费资源
AIGC
3个月前
946
83
Devika-开源的AI编程工具,理解和执行复杂的人类指令
Devika 是什么 Devika是开源的AI编程工具,能理解并拆分复杂指令,基于集成AI搜索和网页浏览能力搜集信息,编写代码实现目标。Devika支持多种AI模型,具备高级规划推理能力,能进行上下文关键词...
免费资源
AIGC
3个月前
361
118
iDP3-斯坦福大学联合多所高校推出的改进型3D视觉运动策略
iDP3是什么 iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的改进型3D视觉运动策略(如三维扩散策略),提升人形机器人在多样化环境中的自主操作能力。与传统3D策略不同,iDP...
免费资源
AIGC
3个月前
600
128
ProactiveAgent-清华联合面壁智能开源的新一代主动Agent交互范式
Proactive Agent是什么 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式 ,具备主动性,能预测用户需求并在没有直接指令的情况下采取行动。Proactive Agent观察环境...
免费资源
AIGC
3个月前
591
101
EMOVA-华为诺亚方舟联合多所高校共同推出的多模态全能处理模型
EMOVA是什么 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOVA能处理图像、文本和语音模态,实现能...
免费资源
AIGC
3个月前
517
67
OminiControl-AI图像生成框架,实现图像主题控制和空间精确控制
OminiControl是什么 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和空间控制,例如边缘引导...
免费资源
AIGC
3个月前
285
102
Talker-Reasoner-谷歌DeepMind推出的双思维AI代理架构
Talker-Reasoner是什么 Talker-Reasoner是谷歌DeepMind推出的双思维AI代理架构,借鉴人类的认知理论,将代理分为两个模块:Talker和Reasoner。Talker模拟人类的快速直觉思维(System 1),处理...
免费资源
AIGC
3个月前
622
76
DiffusionSelf-Distillation-斯坦福大学推出的零样本定制图像生成技术
Diffusion Self-Distillation是什么 Diffusion Self-Distillation(扩散自蒸馏,简称DSD)是斯坦福大学吴佳俊团队推出的零样本定制图像生成技术,用预训练的文本到图像扩散模型自动生成数据集,...
免费资源
AIGC
3个月前
927
35
上一页
1
…
277
278
279
280
281
…
298
下一页
跳转
在手机上浏览此页面
登录
没有账号?立即注册
邮箱
验证码
发送验证码
记住登录
账号密码登录
登录
用户名/手机号/邮箱
登录密码
记住登录
找回密码
|
免密登录
登录
社交账号登录
注册
已有账号,立即登录
设置用户名
设置密码
重复密码
注册
扫码登录
使用
其它方式登录
或
注册
扫码登录