IT之家 5 月 30 日消息,快手自研文生图大模型“可图”已于近日正式对外开放,其目前支持文生图和图生图两类功能,可用于 AI 创作图像以及 AI 形象定制。
用户可通过“可图”微信小程序和网页版使用。据界面新闻报道,这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型的参数规模达十亿级,这些数据来自开源社区、快手内部构建和自研 AI 技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。
报道称,快手内部今年明确了大模型应用策略,主要包含理解、互动和生成三个方向,具体的应用场景包括全域大模型内容理解、AI 互动、商业场景的数字人与 AIGC 等。
经IT之家实测发现,“可图”提供的功能包括“文生图”,以及多款动漫主题、写实人像风格,包括本世纪早期流行的“红钻贵族”、近期较为热门的“粘土世界”风格,以及多种不同风格的“绘画”样式,用户一次可生成最多 4 张图片。
据IT之家此前报道,快手创始人兼 CEO 程一笑曾在今年 3 月放出豪言:有信心在未来半年内,使大模型的综合性能达到 GPT4.0 的水平。同时,他还称快手文生图大模型“可图”综合性能已超过 Midjourney V5 的水平。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/771/912.htm]