Olmo 3 – AI2最新开源的大语言模型系列,支持从编程到推理等多种任务Ai2发布了新一代语言模型家族Olmo3,从训练数据、程序代码、评测流程,到各阶段检查点与用来回溯推理过程的工具都公开,让外部团队可以完整重现与延伸这套模型。模型包括多个版本,Olmo 3-Base...发现5个月前07120
InfinityStar – 字节跳动推出的高效视频生成模型,5秒视频时间缩短至仅58秒字节跳动宣布推出全新 InfinityStar 框架,采用统一的时空自回归架构,能够实现高分辨率图像与动态视频的快速合成。该框架显著提升了视频生成效率,将生成5秒720p 视频的时间缩短至仅58秒。这...发现5个月前07120
Alpamayo-R1 – 英伟达发布首款推理版视觉-语言-动作模型随着芯片成为AI发展的核心,英伟达发布了新的开源软件Alpamayo-R1,旨在利用人工智能(AI)中的一些最新“推理”技术加快自动驾驶汽车的开发。模型的核心创新包括:构建因果链(CoC)数据集,通过...发现资讯5个月前07060
A2UI – 谷歌开源Agent生成用户界面的声明式协议,支持定制化a2ui(agent-to-user interface)是谷歌推出的开源协议,专为ai agent与用户界面之间的高效、安全交互而设计。核心是让AI生成“界面描述数据”,而非可执行代码,客户端通过预...发现资讯4个月前07050
GigaBrain-0 – 最新开源VLA具身模型,打造了全球首个最全具身智能数据体系最新推出的GigaBrain-0是一款基于世界模型(World Model)的视觉-语言-动作(VLA)基础模型,专为机器人复杂操作任务设计。GigaBrain-0通过加入深度信息的输入,提升了物体3...发现资讯6个月前07040
Kotaemon—— 基于 RAG 技术的开源工具,支持多模态检索和复杂推理方法,满足多样化的查询需求Kotaemon 是什么 Kotaemon是一款基于Retrieval-Augmented Generation (RAG)技术的开源工具,由Cinnamon团队开发。它通过结合信息检索和语言生成技术...发现资讯9个月前07040
GLM-ASR – 智谱开源的语音识别系列模型,模型能将语音实时转换为文字GLM-ASR是由智谱AI开发的开源语音识别模型系列,结合了自然语言处理(NLP)和语音识别(ASR)的先进技术。不仅可以实现精准的语音转文字,还可以在输入法中直接调用大模型能力,完成翻译、改写、情绪...发现资讯5个月前07030
twitch官网入口,twitc登录教程twitch是一款全球超火的游戏直播、教学、玩法攻略流媒体平台,它是美国最大的一家游戏视频直播网站,内容几乎涵盖了市面上所有游戏种类。对跨境电商卖家而言,Twitch是很好的营销引流平台。无论是游戏还...发现资讯5个月前07030
TLDW – AI视频摘要工具,支持YouTube视频URL输入或视频文件上传。TLDW是一款专门为优化视频观看体验而设计的AI工具,它可以分析YouTube视频并提取其中的关键时刻,让你用最短的时间获得最有价值的信息。该工具旨在帮助用户将冗长的YouTube视频转化为简洁、易于...发现资讯6个月前07030
MiroFlow v0.2 – MiroMind开源的研究智能体框架,协调多个工具和子智能体完成任务MiroFlow v0.2是MiroMind团队开发的开源研究智能体框架,旨在将任意大型语言模型(LLM)的能力提升至媲美OpenAI深度研究级别的水平。其核心设计聚焦于高效、可靠地执行复杂工具调用任...发现资讯7个月前07030