快讯 – AISCK🏆

12月25

高清修复工具InvSR，实现照片从模糊到高分辨率

16:04 作者:AISCK

InvSR基于扩散反演的新技术，提升图像的分辨率和清晰度。通过“部分噪声预测”策略，该技术在灵活性和效率上超越了现有的超分辨率方法。利用封装在大型预训练扩散模型中的丰富图像先验来提高 SR 性能。设计了一个 \textit{Partial noise Prediction} 策略来构建扩散模型的中间状态，作为起始采样点。方法的核心是一个深度噪声预测器，用于估计前向扩散过程的最佳噪声图。训练后，…

AI快讯

分享到
OpenAI每个o3任务电能消耗=一个美国家庭两个月的用电量

16:04 作者:AISCK

OpenAI推出的o3模型在能耗和环境影响方面引发了广泛关注。每个o3任务的电能消耗相当于一个美国家庭两个月的用电量，且其二氧化碳排放量与五箱满油的汽油相当。这一现象突显了在追求技术进步的同时，必须关注其对环境的影响，尤其是在水资源和能源消耗方面的潜在悖论。

AI快讯

分享到
AI的控制策略，可使微型机器人完成集体操纵或运输物体等任务

16:03 作者:AISCK

康斯坦茨大学和国际理论物理中心的研究团队开发基于AI的控制策略，让200个微型机器人成“AI智能体”，能独立决策并协作完成复杂集体行为，如在实验中运输大件物品成功率超90%且3000次动作内精准达目标，还能完成旋转、运输杆等更复杂行为，在部分机器人故障时也能维持一定工作效率。技术上采用多智能体强化学习（MARL）算法结合“反事实奖励”（CR）机制，为微型机器人设计个性化奖励系统优化其协作行为，克…

AI快讯

分享到
IBM 推出了 Granite 语言模型的 3.1 版本

16:02 作者:AISCK

IBM 推出了 Granite 语言模型的 3.1 版本。此新版本经过重新设计，可处理多达 128,000 个令牌，极大增强了其应对复杂文本和任务的能力。该模型基于 12 种语言以及 116 种编程语言的数据集进行训练，累计处理 12 万亿个令牌，在回答需使用外部数据的问题和从非结构化文本中提取信息等方面表现优异。

AI快讯

分享到
MediaTek：发布天玑8400，5G全大核智能体AI芯片

16:01 作者:AISCK

MediaTek发布天玑8400 5G全大核智能体AI芯片，在架构与性能方面，承袭天玑旗舰芯片先进技术，采用全大核架构，全大核CPU含8个主频至高3.25GHz的Arm Cortex-A725大核，单核性能提升10%、功耗降35%，多核性能提升41%、功耗降44%；GPU峰值性能提升24%、功耗降42%。在AI能力方面，集成旗舰级AI处理器NPU880，结合全大核CPU协同运算，支持多种语言模型…

AI快讯

分享到

12月24

清华大学与腾讯ARC实验室联合研发出ColorFlow新型图像序列上色模型

22:42 作者:AISCK

清华大学与腾讯ARC实验室联合研发出ColorFlow这一新型图像序列上色模型。其主要目的在于处理黑白图像上色时角色身份一致性的难题，采用双分支设计以及创新的检索增强上色管道，这不仅让上色效果得到明显提升，上色效率也大大提高。在众多指标方面，ColorFlow都领先于当前已有的先进模型，所呈现出的美学质量也更高，在黑白漫画、线条艺术等多种艺术领域都能发挥作用。

AI快讯

分享到
百川智能：全链路领域增强大模型Baichuan4-Finance

22:41 作者:AISCK

百川智能发布全链路领域增强大模型Baichuan4-Finance，其基于高质量金融数据与首创自约束训练方案，金融及通用能力出色，在多个金融评测中领先GPT-4o等模型。百川智能创立于2023年4月10日，由王小川创立，目标打造中国版OpenAI，已推出16款大模型并于10月31日推出一站式大模型商业化解决方案。百川智能打造全链路领域增强方案，覆盖模型研发到应用全流程，通过多种方式提升Baic…

AI快讯

分享到
星动纪元：发布端到端原生机器人大模型ERA-42

22:39 作者:AISCK

星动纪元发布端到端原生机器人大模型ERA-42，官方宣称这是业界首次仅靠同一个具身大模型，让五指灵巧手能像人手般灵活使用多种工具，完成上百种复杂操作任务。该模型无需预编程技能，凭泛化和自适应力，能在不到2小时内收集少量数据学会新任务，基于其能力，五指灵巧手星动XHAND1已学会用不同工具完成100多种复杂操作任务。此外，研究显示模型规模扩大时任务成功率明显提升，初步体现类似大语言模型训练中的“S…

AI快讯

分享到
字节TikTok算法负责人陈志杰已开启AI Coding方向创业

22:38 作者:AISCK

12月24日，从多位知情人士处获悉，字节跳动TikTok算法负责人陈志杰或于近期离职，目前，他已经开启AI领域创业，知情人士称，陈志杰创业的方向为AI Coding方向，目前已经在陆续接触投资人。 (蓝鲸财经)

AI快讯

分享到
上海拟打造全球医学AI高地

22:36 作者:AISCK

今日，上海印发《上海市发展医学人工智能工作方案（2025—2027年）》，拟促进人工智能与医学创新深度融合，将上海打造成为具有全球影响力的医学人工智能技术创新、应用示范和产业发展高地。方案提到，推动算法突破与算力提升。加快核心算法技术研发，围绕“通专融合”技术范式创新，推动医学大语言、通用图像、智能交互等大模型开发。依托人工智能公共算力平台，促进多方算力互联互通，强化智能算力集群建设。

AI快讯

分享到

12月23

Unbound Academy：推出完全由 AI 教授学术课程的学校

18:52 作者:AISCK

美国亚利桑那州特许学校委员会批准了一所名为Unbound Academy的新在线学校，其独特之处在于学术课程全部由AI授课。该校申请首次尝试用“AI驱动的自适应学习技术”把课程压缩至两小时内，依靠在线教育平台，按学生学习速度和风格动态调整来教学。学校虽有工作人员，但多为“熟练的指导员”，负责监控学习进度与提供个性化辅导。学术授课两小时外的时间安排各种“生活技能工作坊”，涵盖批判性思维等多方面内容…

AI快讯

分享到
谷歌Gemini：手机端快速总结 PDF 内容

18:51 作者:AISCK

谷歌为AI助手Gemini解锁新技能并集成到搭载Android 15且将其设为默认助手的手机中，“询问此 PDF”作为谷歌官方文件管理器更新内容已开始推送，但并非所有Gemini用户都能用，使用该功能需拥有Gemini Advanced订阅、将Gemini设为安卓手机默认助手且设备运行Android 15系统。记者展示了其具体操作，相关按钮位于Gemini弹窗上方，功能可用时，用户查看PDF文件…

AI快讯

分享到
智谱清言：发布英特尔酷睿Ultra专享版

18:50 作者:AISCK

智谱清言发布英特尔酷睿Ultra专享版，该版本可利用英特尔酷睿Ultra处理器的AI算力，让用户在不联网或弱网、断网时也能在PC本地运行智谱端侧模型使用AI助手。智谱清言涵盖多端且有诸多附加功能，部分用户出于隐私、安全及断网等情况有本地使用需求。此专享版会自动检测PC配置，在符合条件的英特尔酷睿Ultra PC上自动下载端侧模型，借助其本地AI算力为用户提供知识问答、文档撰写等个人助手服务，还…

AI快讯

分享到
算力规模突破 5 万 P！甘肃庆阳建成国产万卡算力集群

18:50 作者:AISCK

2024中国算谷数字产业发展大会在甘肃省庆阳市举行，会上披露庆阳数据中心集群算力规模呈“指数级”增长，机架规模达3.1万架，智算规模突破5万P达到5.1万P，是国内人工智能重要算力保障基地且率先实现算力百分百消纳，还创新实施“绿电聚合”模式，“风光火气储”协同保障，绿电供应率超80%。此外，该集群围绕打造相关基地目标，规划在项目建设期内新增80万架标准机架，要求平均上架率不低于65%，平均PUE…

AI快讯

分享到
“VisionFM”新型基础人工智能模型：助力解决眼科临床任务

18:49 作者:AISCK

香港中文大学研究人员开发出名为“VisionFM”的新型基础人工智能模型，可助力解决眼科临床任务，在诊断和预测多种眼科疾病方面表现出色，其诊断12种眼科疾病时与中级眼科医生相当甚至更精确，预测青光眼进展方面表现超RETFound模型，相关研究已登《NEJM AI》期刊，且随着数据量增加有望应用于更多临床场景。同时，当下医学界对生成式人工智能关注度日益提升，香港人工智能与机器人研究中心今年年初推出基…

分享到

11月04

普渡机器人：发布 11 自由度五指灵巧手 PUDU DH11

17:09 作者:AISCK

普渡机器人发布 11 自由度五指灵巧手 PUDU DH11。该灵巧手基于仿人五指设计，拥有 11 自由度，搭载 12 个触觉传感器区域和内置 1018 个感应矩阵点数。采用金属多股集成钢索，单手最大提拉重量 40kg，耐磨抗拉能力强，且能防水防尘，具备低成本、易维护优势，适应恶劣工况。它采用仿人手结构的绳驱方案及欠驱动机构，降低自身重量和空间占用，相比传统方案有更高的灵活性和柔顺度，能流畅完成握、…

AI快讯

分享到
上海交大、上海 AI 实验室、港中文等发布大型视觉语言模型最新成果 MIA-DPO

17:08 作者:AISCK

上海交大、上海 AI 实验室、港中文等带来最新成果 MIA-DPO，这是面向大型视觉语言模型的多图像增强的偏好对齐方法。它将单图像数据扩展至多图像数据，设计了序列、网格拼贴和图中图三种数据格式，降低数据收集和标注成本且具高度可扩展性。理解多图像上下文是视觉语言大模型发展趋势之一，但多图像易产生幻觉问题且可能削弱单图像任务表现，多图像偏好对齐仍是难题，MIA-DPO 无需人工标注或昂贵 API 解决…

AI快讯

分享到
字节豆包与香港大学：开源全新 RLHF 框架

17:07 作者:AISCK

HybridFlow（开源项目：veRL）是一个灵活高效的大模型 RL 训练框架，兼容多种训练和推理框架，支持灵活的模型部署和多种 RL 算法实现。它采用混合编程模型，融合单控制器和多控制器的优势，能更好地实现和执行多种 RL 算法，显著提升训练吞吐量，降低开发和维护复杂度。实验结果显示，HybridFlow 在各种模型规模和 RL 算法下，训练吞吐量相比其他框架可提升 1.5 倍至 20 倍。该…

AI快讯

分享到
“华西黉医”医学大模型发布

17:06 作者:AISCK

在四川大学华西医院管理大会上，华西医院联合华为数据存储发布“华西黉医”医学大模型。该模型集成了 10 余类通用模型和 50 余类垂域模型，融合了大量医患对话集、共识指南、权威教材、政策法规、影像数据和病历数据，构建了 720 亿参数级的全自主知识产权大模型。华西医院还联合华为基于 FusionCube A3000 训/推超融合一体机和 AI 全流程工具链 ModelEngine 建立了三条医学大模…

AI快讯

分享到

11月02

ChatGPT 的高级语音模式（AVM）登陆 Windows 和 Mac 平台

19:18 作者:AISCK

OpenAI 宣布 ChatGPT 的高级语音模式（AVM）现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行，能让用户像与真人对话一样交流，提供更自然、实时的对话体验且能感知回应用户情绪。该功能在 7 月首次向测试用户开放，9 月底向付费订阅用户推出，OpenAI 透露免费用户也将有机会体验，欧盟地区的 Plus 和 Free 用户需等待。就…

AI快讯

分享到