资讯 - 第264页

发现科技资讯

排序

发布更新浏览点赞

LuxReal – 群核科技推出的AI 3D视频创作平台，快速生成高质量

群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal，基于图像、3D 模型等多模态输入，快速生成主体一致、画面可控的视频内容，适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...

发现资讯

6个月前

06580

LongCat-Image – 美团推出的开源图像生成模型，提供强大的图像编辑能力

美团LongCat团队宣布，开源其最新研发的LongCat-Image模型。模型采用文生图与图像编辑同源的架构，结合渐进式学习策略，成功在6B参数下实现了指令遵循精准度、生图质量与文字渲染能力的高效协...

发现资讯

6个月前

06580

Firefly Image 5 – Adobe推出的最新图像生成模型，支持400万像素原生输出

Adobe上线其最新一代图像生成与编辑模型Firefly Image 5，新模型支持400万像素原生输出，提供图像分层编辑等图像功能，还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升，特别是在人...

发现资讯

7个月前

06550

SceneGen – 上海交大推出的3D场景生成框架，单图到3D场景一步生成

上海交通大学的研究团队推出了一种名为 SceneGen 的新颖框架，在这一领域取得了突破性进展。它以一张场景图像和图中物体的分割掩码作为输入，能够在一次前向传播中，同时生成场景内多个3D资产的几何、纹...

发现资讯

8个月前

06550

LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架，实现跨模态的信息检索

LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架，旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...

发现资讯

8个月前

06540

Mini-o3 – 字节联合港大推出的视觉推理模型，支持多轮交互推理

自字节跳动和香港大学的研究团队推出了 Mini-o3，一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力，使其能够执行长达数十步的深度推理...

发现资讯

9个月前

06540

LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型，比同级自回归模型快 2.1 倍

蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型（dLLM），并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本，打破...

发现资讯

6个月前

06530

LensGo AI – AI内容创作平台，无需专业剪辑技能，满足多样化创作需求

随着科技的飞速发展，越来越多的技术工具涌现出来，LensGo凭借其强大的功能和简洁的操作界面，受到了广大用户的青睐。用户可以轻松实现图像的编辑、优化、分享等操作，提升工作效率和创作体验。允许用户通过简...

发现资讯

6个月前

06530

Workspace Studio – 谷歌推出的AI智能体构建工具，自动生成定制化 AI 智能体

谷歌发布的一款 ai 驱动自动化工具Workspace Studio，支持用户通过自然语言描述即可创建、管理和分享 AI 智能体（AI Agents）的新工具，通过自动化实现简化工作流程。支持智能任...

发现资讯

6个月前

06520

Seedream 4.5 – 字节跳动推出的AI图像创作模型，增强画面的立体感、光影效果

字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在图像生成主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代，进一步提升了的整体质量与稳定性。面向广告...

发现资讯

6个月前

06520

加载更多