快讯

9月14

  • Mistral 首款多模态 AI 模型Pixtral 12B开源,120 亿参数、24GB 大小

    17:52 作者:AISCK

    法国Mistral公司发布首款多模态AI大语音模型Pixtral 12B,有120亿参数、约24GB大小,基于Nemo 12B构建,能回答任意图像相关问题,类似其他多模态模型可执行如为图像加描述、统计物体数量等任务。用户可下载、微调该模型并按Apache 2.0许可证使用,其开发者关系负责人称该模型很快将在公司的聊天机器人和API服务平台开放测试。

    AI快讯
    分享到
  • 何宝宏:到 2026 年,生成式 AI 计算市场规模将突破百亿美元

    17:50 作者:AISCK

    中国国际服务贸易交易会在北京举行,中国信通院云计算与大数据研究所所长何宝宏出席2024通用人工智能算力论坛并演讲“智算产业新发展”。2018 - 2023年全球算力市场平稳增长且智算赛道爆发,清华全球产业研究院对生成式AI计算和其他AI计算市场规模有相关测算(列出2024 - 2026年数据)。何宝宏还指出,国内算力市场持续高速增长,增速虽从超50%回落,但仍保持两位数。

    AI快讯
    分享到
  • 北大提出首个通用指令导航大模型系统

    17:47 作者:AISCK

    北京大学董豪团队提出首个通用指令导航大模型系统InstructNav,该工作已被CoRL 2024会议录用,不同导航任务需要不同能力,之前研究针对特定指令设计导航方法,无法满足人类下达混合类型指令的实际需求,而InstructNav极具价值。团队首先提出动态导航链路范式统一导航指令,利用大语言模型规划链路并在导航中根据场景更新。为引导机器人按链路行动,将规划结果映射到多源价值地图(包括动作、语义、…

    AI快讯
    分享到
  • 谷歌:NotebookLM 新增 Audio Overview 功能,可围绕用户文档展开播客式交流

    15:51 作者:AISCK

    谷歌升级基于Gemini 1.5 Pro AI模型的笔记应用NotebookLM,新增Audio Overview(曾名为Illuminate)功能。 该功能围绕用户上传的Google Docs、Google Slides、PDF文件或网页URL等内容生成AI主持人,以播客形式讨论总结内容。这一基于音频的功能有多方面潜在优势,如提供替代学习方式、便于多任务处理、揭示新视角等,但谷歌强调生成的讨论不…

    AI快讯
    分享到
  • 阿里国际站服贸会上展示AI神器-生意助手

    09:50 作者:AISCK

    阿里国际站在服贸会(中国国际服务贸易交易会)展示AI生意助手,其极简发品功能可大幅缩短商家发品时间,上传产品图或关键词就能自动生成商品全套信息。 该站负责人称阿里国际站致力于让中小外贸企业享受AI产品便利,AI已是中小外贸企业标配。除发品外,助手还有智能接待功能,能提升响应速度和海外买家二次回复率。在AI加持下,助手涵盖智能发品、接待、市场分析等多项功能,覆盖全球贸易多环节,降低中小企业门槛并提升…

    AI快讯
    分享到
  • Readtheirlips:能「看懂」唇语,悄悄话不再安全

    08:49 作者:AISCK

    AI软件Readtheirlips可识别唇语,它能识别红毯明星小声说话的唇语,但实测中发现存在局限性:识别视频时间约一分钟左右;人物不正脸对镜头、语速过快时易出错;目前仅支持3分钟以内视频上传。开发团队Symphonic Labs是初创公司,其工作原理是用标注数据训练模型,用户上传含面部特写(嘴部动作)的视频,模型分析嘴唇几何特征、动态变化并与训练数据匹配以识别内容,最后组合输出文本。

    AI快讯
    分享到
  • 夸克推出CueMe智能对话助手,AI写作能力达2万字

    08:48 作者:AISCK

    9月12日消息,夸克公司宣布推出全新的智能对话助手——CueMe,用户现可通过cueme.cn或夸克App体验这项服务。 据官方介绍,CueMe是基于夸克大模型自主研发的,其AI写作能力尤为突出。CueMe支持不同体裁、不同篇幅的内容生成,最长可生成2万字的内容,满足用户多样化的写作需求。 夸克表示,CueMe在不同细分体裁上进行了充分的语料预训练,能够支持上千种不同体裁的写作需求。无论是研究报告…

    AI快讯
    分享到

9月12

  • AI数字人替人打工,风平智能获近亿元A轮系列融资

    17:53 作者:AISCK

    AI数字人公司风平智能(Fullpeace)已完成累计近亿元A轮系列融资,由璀璨者资本及华为系企业家华鲲资本基金共同投资,包括汇财资本、北京大学人工智能创新中心主任雷鸣、清华大学杰出校友系的基金在内的老股东全部跟投。该笔资金将用于加强核心技术研发,优化AI数字人应用产品和AI营销解决方案。

    AI快讯
    分享到
  • 谷歌:开启Test-Time端新的Scaling Law,小模型性能可超比它大14倍的模型

    14:51 作者:AISCK

    谷歌DeepMind研究发现,在相同计算资源下,小模型性能可超比它大14倍的模型,研究团队探究大模型推理时计算优化方法,发现预训练少用计算资源、推理时多用的策略可能更好。 他们研究了两种扩展测试时计算的机制:一是基于PRM搜索,它能在生成答案过程中评分以调整搜索策略;二是根据prompt自适应更新模型响应分布,有并行采样与顺序修订两种方式。团队提出“计算最优”扩展策略,按prompt难度分配测试时…

    AI快讯
    分享到
  • 零刻首发AMD Zen5迷你机:锐龙AI 9 HX 370核显媲美RTX 3050

    10:48 作者:AISCK

    零刻将在中秋节后上线新款SER9 Zen5架构迷你机,定价暂未公开。其处理器为锐龙AI 9 HX 370,12个Zen5核心,最高频率5.1GHz,16个GPU核心频率2.9GHz,性能提升19 - 32%且有50 TOPS算力的NPU AI引擎。经测试,CineBench R23多核跑分成绩较锐龙9 8945HS提升41%,在几款游戏中的帧率表现基本达到RTX 3050水平。 SER9比SER8…

    AI快讯
    分享到
  • 深圳:鼓励金融企业联合腾讯、华为等科技企业,增强 AI 大模型等在金融领域应用

    09:45 作者:AISCK

    深圳市地方金融管理局消息,《深圳市关于支持数字金融高质量发展的实施意见(征求意见稿)》今日起向社会公开征求意见。 《意见》鼓励金融科技企业源头创新、推动重点方向新产品在金融领域应用,推进金融信创攻关基地建设,鼓励金融企业与科技企业合作增强AI大模型等技术应用;持续深化数字人民币试点等工作并带动产业发展成效明显,目标是到2025年形成5个以上数字金融重点园区或特色楼宇;鼓励国内外机构在深设立相关平台…

    AI快讯
    分享到
  • 马斯克:2025 年末将批量装备 Dojo 2 AI 训练芯片,对标英伟达 B200 系统

    08:49 作者:AISCK

    埃隆·马斯克在All - In Summit 2024活动称,特斯拉AI芯片Dojo 2于2025年末批量装备。在特斯拉AI基础设施中,Dojo负责模型训练,车端芯片负责模型推理,特斯拉还将推出多代Dojo芯片。 Dojo 2可与英伟达B200 AI训练系统在一定程度可比,Dojo 3可能2026年晚些时候推出,马斯克认为技术经3次重大迭代才达卓越水平,到Dojo 3才能知晓该系列芯片多优秀。特斯…

    AI快讯
    分享到

9月11

  • 谷歌Illuminate:复杂论文一键变博客

    18:52 作者:AISCK

    谷歌推出Illuminate,可将学术论文转化为生动的音频播客,让学习变得轻松有趣。通过强大的语言模型Gemini,论文内容转换成引人入胜的对话,让用户在碎片时间里也能轻松获取知识。虽然还有改进空间,但Illuminate为学习带来全新体验。

    AI快讯
    分享到
  • 机器人也会系鞋带了!斯坦福团队用模仿学习赋予机器人新技能

    17:50 作者:AISCK

    斯坦福团队教机器人系鞋带并发布全球首个相关演示视频,这个机器人(Aloha 2)相比之前的炒菜版机器人能执行更轻巧复杂任务。Aloha 2除系鞋带外还会挂衣服、拧齿轮、收拾厨房、给“同事”换配件等。为训练它,研究团队使用扩散策略收集2.6万个示范数据进行大规模训练,基于模仿学习而非强化学习,其神经网络架构参考ACT模型。 研究人员按特定步骤操作,如给嵌入加位置嵌入等,基础模型有2.17亿可学习参数…

    AI快讯
    分享到
  • AI面部表情编辑神器Reshot AI来了

    11:48 作者:AISCK

    Reshot AI是一款先进的人工智能照片编辑器,专精于个人头像与专业图像处理,利用AI简化并提升编辑效率。其特色包括面部修复、智能优化表情、姿势及光线,以及自然光影效果,能够创造多样且专业的形象。此外,还提供换脸、模因制作、背景更换等创新功能。

    AI快讯
    分享到
  • LIama3+Mamba强强联手!蒸馏到线性RNN,推理速度提升1.6倍

    10:54 作者:AISCK

    Together AI 将 Llama 3 蒸馏到 Mamba,性能不减甚至更优,推理速度最高可提升 1.6 倍。该项目由提出 Mamba 架构的 Tri Dao 参与。在蒸馏过程中,先进行从 Transformer 到线性 RNN 的初始化,利用 Transformer 注意力机制与 RNN 计算的相似性建立联系并复制参数,后采用三阶段蒸馏流程提升 Mamba 性能,包括基于伪标签的蒸馏、在指令…

    AI快讯
    分享到
  • 月之暗面Kimi智能助手Kimi API现已支持联网搜索功能

    09:47 作者:AISCK

    Kimi API推出联网搜索功能,用户可以通过API获取互联网信息,提升交互体验。这一更新使开发者能够实现应用程序自动进行网络搜索并提供答案,省心快速兼容。费用方面需支付调用费用和Tokens费用。更新提升了用户体验,拓展了Kimi智能助手的应用场景,增加了开发者灵活性和便利。

    AI快讯
    分享到
  • Audible 推出 AI 生成有声读物,叙述者将训练并参与创作

    08:50 作者:AISCK

    亚马逊让有声读物解说员用AI“克隆”自己的新功能,旨在加快有声书制作速度,为解说员提供更多创作机会,同时推动有声书市场的发展。这项功能将通过AI技术训练解说员的语音克隆,参与者将获得报酬并控制参与的项目,确保AI克隆的使用需解说员同意。

    AI快讯
    分享到
  • 通用端到端OCR模型开源,拒绝多模态大模型降维打击

    07:52 作者:AISCK

    Vary 团队开源 OCR-2.0 的通用端到端模型 GOT。该模型在 PDF image 转 markdown、双栏文本感知、自然场景及细粒度 OCR、动态分辨率 OCR、多页 OCR、更多符号 OCR 等方面的能力更强。尽管 GOT 表现不错,但存在一些局限,如更多语言支持、更复杂几何图及 chart 上的 OCR 性能有待提升。 GOT 的通用体现在输入支持多种 OCR 任务,输出同时支持 …

    AI快讯
    分享到

9月10

  • 元宇宙平台”Roblox 将推出 3D 模型生成 AI 工具

    22:48 作者:AISCK

    Roblox平台在开发者大会中宣布提高游戏创作者分成比例、集成电商平台,并推出基于 AI 的 3D 模型生成工具吸引开发者创建游戏地图。Roblox 指出全球约 34 亿人玩游戏,产业年规模约 1800 亿美元,目标是日活量达 10 亿时获 10%收益。公司内部正在开发多模态 3D 基础 AI 模型并计划开源,该模型可通过文本、视频或 3D 提示生成 3D 内容,提供广泛生成式 AI 功能,支持游…

    AI快讯
    分享到

个人中心
购物车
优惠劵
有新私信 私信列表
搜索

亲爱的同学, AISCK不支持网页右键喔!

你可以鼠标左键选择内容后,按Ctrl+C复制

嗨! 我是AI助手Ceres