-
小米智能家庭屏系列产品获大模型升级,适配小爱触屏音箱 Pro 8 等 6 款设备
IT之家11月25日消息,小米官方今日发文宣布,小米智能家庭屏系列产品开启大模型功能升级推送,支持超级问答、闲聊对话等功能,适配小爱触屏音箱Pro8等6款设备。IT之家附小米智能家庭屏系列产品此次升级情况如下:支持功能超级问答闲聊对话文本内容生成适配机型Xiaomi智能家庭屏10Xiaomi智能家庭屏Pro8Xiaomi智能家庭屏6小米小爱触屏音箱Pro8Redmi小爱触屏音箱Pro8Redmi小17 0 2024-11-25 12:03
-
写给小白的大模型入门科普
引言:网上关于大模型的文章也很多,但是都不太容易看懂。小枣君今天试着写一篇,争取做到通俗易懂。废话不多说,我们直入主题。█什么是大模型?大模型,英文名叫LargeModel,大型模型。早期的时候,也叫FoundationModel,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是19 0 2024-11-23 13:27
-
首个可保留情感的音频 LLM:Meta 重磅开源 7B-Spirit LM,一网打尽“音频 + 文本”多模态任务
Meta最近开源了一个7B尺寸的SpiritLM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型(SpeechLMs)也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音28 0 2024-11-22 13:06
-
昆仑万维推出“天工大模型 4.0”4o 版及实时语音助手 Skyo,号称可克服大模型幻觉
IT之家11月20日消息,今天上午,昆仑万维宣布推出“天工大模型4.0”4o版(Skywork4o)以及新产品“实时语音对话助手Skyo”。据官方介绍,Skyo作为一个智能语音互动产品,具备快速响应、多语言对话能力,它能够主动发起对话、实时打断,能够克服大模型的“幻觉”问题,在对话中回复真实内容。同时,Skyo具备情感化反应和个性化声音定制功能。“天工大模型4.0”4o版具备如下特征:高效响应速度51 0 2024-11-20 18:18
-
华为、百度、阿里云、腾讯云、蚂蚁集团等发起“大模型基础设施高质量发展行动计划”
IT之家11月13日消息,中国人工智能产业联盟第十三次全会于11月12日在北京召开,华为数据存储联合中国信通院、工信部人工智能关键技术和应用评测实验室、工商银行、中国移动、中国联通、百度、阿里云、腾讯云、蚂蚁集团等正式发起“大模型基础设施高质量发展行动计划”。IT之家从大会获悉,该计划以提升大模型基础设施的质量与效能为目标,共同加快布局“高效计算调度+高性能AI存储+高通量网络+高效能开发平台+智86 0 2024-11-13 09:18
-
告别“默片”:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频
感谢IT之家网友HH_KK的线索投递!IT之家11月8日消息,智谱技术团队今天发布并开源最新版本的视频模型CogVideoXv1.5,相比于原有模型,CogVideoXv1.5将包含 5/10秒、768P、16 帧的视频生成能力,I2V模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。 官方介绍,CogVideoXv1.5也将同步上线到“清影”平台,并与新推出的CogS89 0 2024-11-08 16:21
-
腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型
IT之家11月5日消息,腾讯混元今日开源了Hunyuan3D-1.0大模型,官方称这是首个同时支持文生和图生的3D开源大模型。▲文生模型▲图生模型模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10秒即可生成3D资产:第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约4秒内生成多视角图像。这些多视角图像从不同的视角捕捉了3D资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多89 0 2024-11-05 18:51
-
腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型
IT之家11月5日消息,腾讯今日宣布推出 Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和Hunyuan-84 0 2024-11-05 16:15
-
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
IT之家11月3日消息,字节跳动豆包大模型团队与香港大学公开联合研究成果——HybridFlow。官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型RL训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种RL算法实现。该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现96 0 2024-11-03 15:27
-
消息称 Kimi、豆包等 AI 应用本月广告投放超 3 亿元,开始“卷”投流
IT之家10月30日消息,据钛媒体App今日报道,截至10月29日,kimi智能助手、字节跳动豆包、腾讯元宝等所有AI应用10月全网广告投放(投流)支出超过3亿元人民币。在AI应用领域,本月kimi智能助手全网广告投放(投流)金额最高,为1.99亿元人民币,远超过7-9月第三季度的总和1.7亿元,其中10月,有86.52%的广告创意投向巨量广告/千川平台;10月,字节跳动的豆包App投放了2200108 0 2024-10-30 13:33
-
大模型生成 RPG 游戏,情节角色全自定义!谷歌出品,一作上海交大校友
现在,大模型能生成RPG角色扮演游戏了。根据初始用户输入,它能设置游戏模拟环境,并在环境中生成角色动作。来自谷歌,北卡罗来纳大学教堂山分校新研究,他们尝试的第一款游戏叫作Unbounded,灵感来自《模拟人生》。用户可以自定义角色的人生,比如这位名叫Archibus的巫师,他的饥饿度、能量和兴趣度会随着环境进行相应更新。角色可以自由探索各种环境,进行各种可能的动作和互动。游戏按照交互速度,每秒就会68 0 2024-10-26 13:33
-
中国移动上海产业研究院:金融领域 AI 大模型渗透率过半,系行业最高
IT之家10月21日消息,据《北京商报》周日报道,在2024金融街论坛年会“AI+金融赋能数字金融新篇章”平行论坛上,中国移动上海产业研究院副总经理陈豫蓉介绍,金融领域是大模型渗透率最高的行业,渗透率超过50%。智慧销售、智能问答和智能风控是现阶段金融行业最热门,也是应用成熟度最高的AI大模型应用场景。IT之家从报道获悉,金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,被视为大模型技73 0 2024-10-21 09:03
-
相关人士回应字节大模型遭实习生攻击:破坏训练属实,损失金额及处理方式被夸大
IT之家10月19日消息,据“证券时报・e公司”报道,接近字节跳动的人士今日就“字节大模型遭实习生攻击”一事表示,确有实习生破坏AI模型训练,但损失金额和处理方式被夸大。IT之家附前情提要:近期流传消息称,今年6月,某高校博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。截至目前,官方未进行回应。传闻显示,该田姓实习生利用了HF(huggingface)的114 0 2024-10-19 12:54
-
阿里国际 Marco 翻译大模型发布:支持中英日韩西法等 15 种主流语言
感谢IT之家网友小星_14的线索投递!IT之家10月16日消息,据阿里国际AI团队AIDC-AI,阿里国际最新研发的翻译大模型Marco于今日正式上线,支持中、英、日、韩、西、法等15种全球主流语种。官方称其基于目前广泛使用的开源评测数据集Flores,Marco翻译大模型在BLEU自动评测指标上,领先于市面上的标杆翻译产品,如Google翻译、DeepL、GPT-4等。“你的宝贝正在路上”,不会106 0 2024-10-16 12:33
-
工信部:我国生成式人工智能服务大模型的注册用户已超 6 亿
IT之家10月13日消息,据央视新闻报道,工业和信息化部昨日表示,目前我国生成式人工智能服务大模型的注册用户数量已突破6亿。图源Pixabay据工业和信息化部总工程师赵志国介绍,我国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众提供服务的生成式人工智能服务大模型近200个,注册用户超过6亿。赵志国指出,一批人工智能领域专精特新企业茁壮成长,技术创新能力不断提升,专94 0 2024-10-13 07:39
-
中国移动发布九天善智多模态基座大模型及 30+ 款自研行业大模型
IT之家10月12日消息,IT之家从中国移动官网获悉,今日在第12届中国移动全球合作伙伴大会主论坛上,中国移动发布九天善智多模态基座大模型,并推出30款自研行业大模型。中国移动对九天善智多模态基座大模型的介绍如下:本次发布的九天善智多模态基座大模型是九天系列通用大模型的最新研发成果,模型四大功能显著提升:一是长文本智能化解析,支持超十万字的文本理解,从多份文档中自动分析提炼关键信息,准确解析信息背113 0 2024-10-12 13:57
-
字节跳动发布 GR-2 机器人 AI 大模型:任务平均完成率 97.7%,模拟人类学习处理复杂任务
IT之家10月10日消息,字节跳动研究团队最新推出了第二代机器人大模型GR-2(GenerativeRobot2.0),其亮点在于创新构建“机器人婴儿期”学习阶段,模仿人类成长学习复杂任务,具备卓越的泛化能力和多任务通用性。GR-2模型和其它很多AI模型一样,包括预训练和微调两个过程。在预训练阶段,GR-2“观看”了多达3800万个来自各类公开数据集的互联网视频以及500亿个tokens,涵盖了家108 0 2024-10-10 09:42
-
文生视频平台 Pika 1.5 升级:万物皆可爆炸,搞笑特效全网病毒式疯传
重磅更新的Pika1.5,简直要把社交媒体炸翻了!网友们惊叹:现在的AI视频,已经进化到这种程度了?不仅效果惊艳有趣,这次发布的用户使用手册也让AI视频更加大众化,连小白都可以轻松上手了。时隔多月,斯坦福华人团队创办的Pika终于官宣——新一代AI视频模型来了。刚一上线,全新的特效功能就让全体网友玩疯了!喊着「臣妾做不到啊」的皇后、深情对视的四郎和嬛嬛,忽然被挤瘪。脸上洋溢着神秘微笑的蒙娜丽莎,开97 0 2024-10-03 15:06
-
中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源
IT之家9月28日消息,“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(IT之家注:下文称TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型TeleChat2-115B。官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全125 0 2024-09-28 18:45
-
陈睿:B站已上线自研大模型 index 并应用于 AI 字幕,具备近 10 种语言实时翻译能力
感谢IT之家网友西窗旧事的线索投递!IT之家9月26日消息,据澎湃新闻报道,在今天的2024年中国国际智能传播论坛上,哔哩哔哩董事长兼CEO陈睿表示,B站上线了自研大语言模型index,并将其应用于AI字幕。目前,B站具备中、英、韩、日、泰语等近10种语言的实时翻译能力,准确度接近90%。陈睿表示,B站更看重拥抱开源的生态,自研大模型就是建立在开源的基础上,相信开源将会成为AI中的主流。同时,AI103 0 2024-09-26 22:03