AI一线|ShareCentre
Открыть в Telegram
2025 год в цифрах

14 237
Подписчики
-324 часа
-117 дней
+5630 день
Архив постов
Kimi K2大模型正式发布:1万亿参数MoE架构,工具调用与编程能力领先业内
【2025年7月11日】开源大语言模型Kimi K2正式发布,采用前沿的Mixture-of-Experts(MoE)架构,总参数达1万亿(1T),每次推理激活32亿参数(32B)。该模型在多个标准评测中刷新成绩,在推理、数学、编程、多语言处理及工具使用等任务中均展现出业内领先性能。
📌 模型架构与技术特点
• 架构:Mixture-of-Experts(MoE)
• 总参数量:1T
• 激活参数量:32B
• 专家数量:384,激活8个/Token
• 上下文长度:支持最长128K
• 稀疏激活机制:仅激活小部分专家参与计算,兼顾性能与成本
• 优化器:采用MuonClip,具备大规模稳定训练能力
• 隐藏维度:Attention维度7168,每专家MoE维度2048
• 注意力机制:采用MLA(Multi-Level Attention)机制
• 激活函数:SwiGLU
• 词表规模:160K
⸻
🧠 模型版本
• Kimi-K2-Base:适用于自主训练和个性化定制
• Kimi-K2-Instruct:用于通用对话、任务处理,具备强大agent能力(含工具调用)
在多个权威评测中,Kimi K2均表现优异:
• SWE-bench Verified(Agentic):单次尝试准确率达65.8%,多次尝试准确率达71.6%。
• 数学与STEM任务:MATH-500达97.4%,AIME 2024达69.6%。
• 通用任务:MMLU-Redux达92.7%,超越大多数开源及闭源模型。
• 工具使用任务:Tau2多个领域测试中平均准确率超过60%。
⸻
🚀 推理部署与兼容性
• ✅ 支持推理引擎:vLLM、SGLang、TensorRT-LLM、KTransformers
• ✅ 支持API接口:OpenAI / Anthropic 兼容,支持工具调用(Function Calling)
• ✅ 推荐温度设置:temperature = 0.6
• ✅ 模型格式:Block-FP8,适用于高效部署
• ✅ 开源协议:Modified MIT License
⸻
🔗 官方资源链接
• 🌐 官网访问与API调用平台:https://platform.moonshot.ai
• 🧠 模型权重下载(Huggingface):https://huggingface.co/moonshotai
• 📦 GitHub代码仓库:https://github.com/MoonshotAI-Kimi/Kimi-K2
• 🛠️ 模型部署指南:https://github.com/MoonshotAI-Kimi/Kimi-K2/tree/main/deploy
• 📫 技术支持邮箱:support@moonshot.cn
Фото недоступноПоказать в Telegram
🚇 v2paw.com – 你的稳定跨境专线首选
🌐 真·IEPL三线接入
→ 不是绕路回国线路,无QoS、不限速,打游戏/跨境办公/奈飞/开发全能选手!
🔐 每*人独立入口
→ 999组 / 3000+ IP,遇到被打/被通报?一键排查内鬼,干净利落。
💸 价格超香
→ 月付 💰15块=100G,IEPL全1倍率,不玩虚的
→ 年付只要144,一顿饭钱=一年安心
👨💻 海外团队运营
→ 不在墙内,无跑路焦虑。稳定更新,有问题也能秒响应!
⸻
适合谁?
🧑💻 稳定开发
📦 跨境电商
🎮 延迟敏感玩家
🎬 解锁流媒体
📡 只想找个踏实机场的人
🛠 支持全协议 / 多平台 / 节点干净 / 面板简洁
🔗 官网:https://v2paw.com
📢 欢迎体验,不稳不要钱系列
马斯克在争议声中发布Grok 4,称其为“全球最聪明AI”
【2025年7月10日,旧金山】由埃隆·马斯克领导的人工智能公司xAI于本周三晚间正式发布最新旗舰AI模型——Grok 4。马斯克在直播发布会上高调称其为“世界上最聪明的人工智能”,并声称该模型“在所有学科中同时胜过几乎所有研究生”。
Grok 4在演示中展示了强劲性能,尤其在由2500道涵盖数学、人文、自然科学等多学科的“人类最后一场考试”评测中表现卓越,超越了谷歌的Gemini 2.5 Pro以及OpenAI的o3高阶模型。
xAI此次发布了两个版本的Grok 4:标准版和更强大的Grok 4 Heavy,分别通过每月30美元和300美元的订阅计划提供。
尽管Grok 4的发布受到了广泛关注,但发布前一天,Grok聊天机器人因在社交平台X上发布一系列涉及反犹和美化希特勒的言论而引发巨大争议。这些贴文自称启用了“机甲希特勒模式”,甚至称这是其“默认设定”。xAI随后删除相关内容并调整了系统提示词,试图遏制仇恨言论。
马斯克在发布会上未正面回应此争议,仅表示“我们必须确保AI是一个‘好AI’,是一个‘好Grok’”,并强调“AI最终会比人类聪明,但我们可以为它植入正确的价值观”。
马斯克还大胆预测,Grok 4或将在今年底或明年初“发现新的技术甚至物理定律”,尽管他以往关于技术发布的时间表屡次跳票仍令人存疑。
此次发布再次凸显了xAI在AI竞赛中的野心,同时也引发了有关AI伦理与安全性的更深层担忧。
智谱AI发布GLM-4.1V-Thinking视觉语言大模型
北京 - 智谱AI近日正式发布GLM-4.1V-9B-Thinking开源视觉语言大模型,该模型基于GLM-4-9B-0414基座模型开发,首次在视觉语言模型中引入思考推理范式。
技术特性
GLM-4.1V-9B-Thinking采用课程采样强化学习(RLCS)技术,在保持9B参数规模的同时,实现了显著的性能提升。模型具备以下主要特性:
长上下文支持:支持64k上下文长度
高分辨率处理:支持任意长宽比和高达4k的图像分辨率
多语言能力:提供中英文双语支持
推理机制:引入"思维链"推理机制,提升回答准确性和可解释性
性能表现 根据官方测试数据,GLM-4.1V-9B-Thinking在多项评测中表现出色: 在28项评测任务中,有23项达到10B级别模型最佳性能 在18个榜单任务中,性能持平甚至超过参数量达到72B的Qwen-2.5-VL模型 开源与服务 智谱AI同时开源了GLM-4.1V-9B-Base基座模型,并在多个平台提供服务。 在线体验 Hugging Face演示平台:https://huggingface.co/spaces/THUDM/GLM-4.1V-9B-Thinking-API-Demo ModelScope演示平台:https://modelscope.cn/studios/ZhipuAI/GLM-4.1V-9B-Thinking-Demo API服务 智谱大模型开放平台:https://www.bigmodel.cn/dev/api/visual-reasoning-model/GLM-4.1V-Thinking 模型下载 GLM-4.1V-9B-Thinking (推理模型) Hugging Face:https://huggingface.co/THUDM/GLM-4.1V-9B-Thinking ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-4.1V-9B-Thinking GLM-4.1V-9B-Base (基座模型) Hugging Face:https://huggingface.co/THUDM/GLM-4.1V-9B-Base ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-4.1V-9B-Base 技术资源 研究论文:https://arxiv.org/abs/2507.01006 模型算法代码:https://github.com/huggingface/transformers/tree/main/src/transformers/models/glm4v 开发者社区:https://discord.com/invite/8cnQKdAprg 技术要求 模型推理方面,单张NVIDIA A100显卡最低需要22GB显存,使用transformers框架可达到14-22 tokens/s的生成速度,使用vLLM可提升至60-70 tokens/s。该模型已获得LLaMA-Factory框架支持,便于研究人员进行进一步的模型微调和应用开发。模型代码遵循Apache License 2.0协议,模型权重采用MIT协议开源。 #智浦 #GLM #开源
❤ 2
Repost from 科技圈🎗在花频道📮
Фото недоступноПоказать в Telegram
字节跳动Seed团队公布2025高考全科测试成绩
字节跳动Seed团队公布2025高考全科测试成绩(基于全国新一卷和山东省自主命题)。Gemini 2.5 Pro、豆包1.6-Thinking分别在理科和文科科目上获得655分和683分的最高分。
特别的,在获得更高清版本的高考试题图后,Seed团队重新采用图文交织的方式,对图片理解依赖比较强的科目(生物和化学)重新进行推理测试,发现Seed1.6-Thinking在生化两科上的总分可再提升近30分(理科总分达到676)。这说明结合文本和图片进行全模态推理可以更大程度激发模型的潜力,相信这也是未来值得投入的研究方向。
字节跳动
📮分享投稿 ☘️频道 🍵茶馆
❤ 2
Repost from TgId: 1184480459
MiniMax发布视频模型Hailuo 02,支持原生1080P高清视频直接输出
上海人工智能企业MiniMax正式发布其新一代视频生成模型Hailuo 02。Hailuo 02支持原生1080P高清视频的直接输出,并在场景快讯变换中的动作流畅且细微表情,拥有较强时空一致性和物理逻辑性,并实现SOTA指令遵循。据MiniMax官方,Hailuo 02是目前全球唯一一个可以实现类似体操这种高度复杂场景的视频大模型。
上海稀宇科技透露,MiniMax采用了一种名为“Noise-aware Compute Redistribution (NCR)”的新模型架构。让Hailuo 02在训练和推理效率上实现了2.5倍的提升,同时Hailuo 02的模型参数量和训练数据量分别达到了上一代产品的3倍和4倍,成本依然可控。
目前海螺视频的Web、APP以及MiniMax开放平台均已上线Hailuo 02新版模型,分别有三个版本:768p-6s,768p-10s,和1080p-6s。(界面)
🗒 标签: #MiniMax #xAI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
❤ 1
Repost from 科技圈🎗在花频道📮
Фото недоступноПоказать в Telegram
Gemini 2.5模型家族扩展:Flash与Pro稳定版本,Flash-Lite亮相
Google宣布扩展其Gemini 2.5模型家族。目前,2.5 Flash和2.5 Pro已发布稳定版本并普遍可用,同时公司推出了2.5 Flash-Lite的预览版,该模型被定位为迄今最经济、速度最快的2.5系列产品。
2.5 Flash-Lite在编码、数学、科学、推理及多模态基准测试中表现优于2.0 Flash-Lite,擅长高容量、低延迟任务。该模型已在Google AI Studio和Vertex AI提供预览,Flash与Pro稳定版亦在这些平台及Gemini应用中上线。
Google Blog
📮投稿爆料 ☘️频道 🍵茶馆
Фото недоступноПоказать в Telegram
云幕 HK海外测试版本 资源未齐
群组 https://t.me/NubeBelle
IOS三方应用端
https://fileball.app/
删档公测BOT(千万不要用网页观看)
@nubebelle_bot
Emby视频教程
https://t.me/NubeBelle/8625
Emby可用国家/地区
https://t.me/NubeBelle/8629
进度状态
国内CDN:❌
海外CDN:✅
硬盘(色情+追新):✅
网盘(大量旧片):❌❤ 1
Repost from 科技圈🎗在花频道📮
Фото недоступноПоказать в Telegram
OpenAI CEO宣布降低o3 80%的价格以及暗示即将发布o3-pro,OpenAI将采用谷歌云服务以扩充算力
OpenAI已与谷歌云达成协议,将采用其云服务以满足日益增长的人工智能算力需求。此举是OpenAI在其主要支持者微软Azure之外,实现计算资源来源多样化的最新举措。
对谷歌云而言,赢得OpenAI这一客户是其云业务的一项重大胜利,尽管两家公司在AI应用层面是直接的竞争对手。
Sam Altman | 路透社
📮投稿 ☘️频道
❤ 1
Repost from TgId: 1420767960
Фото недоступноПоказать в Telegram
Gemini 2.5 pro 版本更新
现已更新 0605 版本,可在AI Studio试用或通过API调用
❤ 2
机场 IDC 发卡 游戏 视频 论坛
原生H5 微信支付宝双通道 d0结算
通道费率:5%
结算方式: USDT 欧易U价+0.15
结算门槛: 100元
结算周期: D0 全自动结算秒到 支持每满xx自动提币
用户福利:免费代买云服务器,域名,iP 。代买各类产品,代转账,纯白资金代付。
本支付今日起帮助在跑商户免费提供RMB代付推广佣金,具体代付需求联系客服,及管理。
开户联系 @Dexunyun
❤ 2
DeepSeek-R1-0528 更新:推理能力显著提升,书写更贴近人类偏好
2025年5月29日DeepSeek宣布其R1模型完成小版本升级,最新版本为DeepSeek-R1-0528。用户可通过网页、APP或小程序的“深度思考”功能体验新版模型,API也已同步更新,调用方式保持不变。
深度思考能力显著增强 新版DeepSeek-R1-0528基于2024年12月发布的DeepSeek V3 Base模型,通过优化后训练大幅提升了推理能力。在AIME 2025测试中,模型准确率从旧版的70%提升至87.5%,平均每题使用23K tokens,相较旧版的12K tokens,展现出更详尽的解题过程。在数学、编程和通用推理等多个基准测试中,DeepSeek-R1-0528表现优异,部分指标已媲美国际顶尖模型如OpenAI的o3和Gemini-2.5-Pro。例如: AIME 2024:准确率91.4%,接近o3的91.6%。 LiveCodeBench(代码生成):准确率73.3%,超越Qwen3-235B的66.5%。 此外,通过对Qwen3-8B Base模型的思想性训练,DeepSeek推出了DeepSeek-R1-0528-Qwen3-8B。该8B模型在AIME 2024测试中表现仅次于R1-0528,超越Qwen3-8B约10%,并与Qwen3-235B相当。 书写能力优化,句式更自然 新版模型针对“句式生硬”问题优化,句式流畅度提升45%-50%。在生成摘要、阅读理解和长篇写作等场景中,输出更准确、结构更清晰,写作风格更贴近人类偏好,能创作出篇幅更长、内容更连贯的作品。 DeepSeek-R1-0528支持工具调用,但在“深度思考”模式下暂不支持工具调用。模型在Tau-Bench测试中表现与OpenAI o1-high相当,但与o3-High和Claude 4 Sonnet仍有差距。模型权重已开源,上下文长度达128K(网页、APP和API提供64K上下文),可在以下平台下载: ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528 Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528采用MIT License许可,允许自由使用和训练衍生模型。 更多详情,请访问:https://api.deepseek.com/zh-cn/news/news250528
❤ 5👍 1
