发现 - 第29页

发现科技资讯

排序

发布更新浏览点赞

Manzano – 苹果推出的图像理解和生成模型，能同时实现图像理解和图像生成

苹果的研究团队提出了Manzano模型，旨在设计一个能够和谐统一理解与生成任务的简洁、可扩展的架构。在多个行业基准测试中，该模型均表现出色。Manzano 模型不仅可完成经典图像编辑任务，还能实现提示...

发现资讯

9个月前

07790

火山引擎推出的AI视频生成模型– 1.0 pro fast ，速度提升约3倍，成本降低72%

火山引擎正式上线豆包视频生成模型 1.0profast。该模型在继承 Seedance1.0pro 模型核心优势的基础上，实现了显著的效率突破：生成速度最高提升约 3 倍，价格直降 72%。pro f...

发现资讯

8个月前

07770

ERNIE-4.5-VL – 百度文心开源的新一代多模态AI模型，新增视觉定位与”图像思考”功能

百度文心4.5系列模型重磅开源，其中 ERNIE-4.5-VL 视觉语言模型（ERNIE-4.5-VL-28B-A3B；ERNIE-4.5-VL-424B-A47B）以卓越的图文视频理解能力，支持10...

发现

7个月前

07750

VibeVoice – 微软推出的开源文本转语音模型，支持动态对话和交互式应用

近日，微软研究院提出了一种全新的语音生成模型 VibeVoice。它能够将文字脚本直接转化为流畅、自然的长对话音频。创作者无需再为音色匹配、语速调整、对话间隔等细节问题耗费精力，只需提供一份带角色标注...

发现资讯

10个月前

07750

Neovate Code – 蚂蚁集团开源的AI编程助手，支持开发者用自然语言描述编程需求

neovate code 是由蚂蚁集团推出的开源智能编程助手，致力于全面提升开发效率。该工具具备深度理解代码库的能力，能够遵循项目现有的编码风格，支持通过插件系统灵活扩展功能。目前以命令行工具（cli...

发现资讯

9个月前

07730

深度赋能，化繁为简：用deepfig工作流自动化重塑企业运营效率

deepfig是什么？ deepfig是一款强大的智能流程自动化（IPA）平台。它的核心使命是打破企业内部的“数据孤岛”和“系统壁垒”，通过无需代码的可视化方式，将那些原本需要人工在不同软件、平台之间...

发现资讯

10个月前

07730

FastVLM – 苹果开源的视觉语言模型，能够准确理解和生成与图像内容

FastVLM是一款专为高分辨率图像处理优化的视觉语言模型，基于苹果自研的MLX框架开发，专为Apple Silicon设备量身定制。FastVLM支持完全本地化处理，无需依赖云端上传数据，完美契合苹...

发现资讯

11个月前

07730

Veo 3.1 – 谷歌推出的AI视频生成模型，能快速生成高质量的视频

谷歌正式发布最新一代AI视频生成模型 Veo 3.1，该模型支持生成4秒、6秒或8秒的720P或1080P视频片段并自带音轨，可通过文本提示、图像或视频片段输入生成内容，提供首尾帧插值、场景延展及多图...

发现资讯

8个月前

07720

Voost – 创新的双向虚拟试穿和试脱AI模型，增强服装与身体的关系推理能力。

NXN Labs的研究团队开发了一个叫做Voost的人工智能系统，旨在提升虚拟试衣和试脱技术的表现。就像是一个超级聪明的"换衣魔法师"。这个系统最神奇的地方在于，它不仅能让你"试穿"任何衣服，还能从穿...

发现资讯

11个月前

07720

Rocket.new – AI编程平台，快速构建和部署全功能的 Web 和移动应用

Rocket.new致力于通过自然语言指令直接生成可投入实际使用的生产级应用。这一战略定位使其在AI驱动开发的激烈赛道中脱颖而出，展现出独特的竞争力。Rocket.new首次生成应用平均耗时约25分钟...

发现资讯

9个月前

07710

加载更多