“正大期货"
扫码下载APP
作者: 正大期货 来源:https://www.xasswkj.com/ 阅读次数:次 2024-05-15 11:35 【字体: 大 中 小】
凭证我们不完全统计,字节跳动旗下现在已经有 11 款面向 C 端用户的自力产物,涉及 AI 确立平台、AI 谈天工具、教育、互动剧情、修图等 5 个种别。
除了在前两篇文章中提到的 8 款产物,今天又带来了 AI 生图产物 PicPic、AI 教育产物河马爱学、AI 剧情互动产物猫箱 3 款 App。
下文将借助详细的产物,剖析字节跳动在做 AI 应用上的一些思绪和战略。
1、PicPic:AI 写真 文生图,外洋复制妙鸭相机之路?
PicPic 是字节跳动面向东南亚市场推出的定位“妙鸭 Dreamina”的 AI 生图产物。
差异于妙鸭相机需支付 9.9 元才气最先制作自己的数字兼顾,PicPic 现在包罗确立数字兼顾、选择模板、文生图在内的生图功效均免费向用户开放。
凭证点点数据,PicPic 自 2024 年 2 月 8 日上线以来累计获得了 11 万次下载,其中 75% 来自菲律宾,余下来自马来西亚。
从市场选择和变现战略来看,PicPic 似乎并不需要肩负太多营收指标。而且从 Cici、BagelBell 等产物的上架和营销区域来看,字节似乎更倾向于先在东南亚市场举行产物测试,取得一定效果后再带到中国市场和其他市场。总体来看,只管产物许多,但在现实投入上似乎加倍倾向于守旧蹊径。
另外,其着实已往的这些年显著能感受到字节是“时光机效应”的受益者,不外差异于古早互联网时期将外洋产物思绪带回海内,字节运用自己怪异的内陆化优势和增进能力将已经在海内或者其他区域市场获得验证的产物带到全球,从现在上线的产物来看,似乎在 AI 时代仍设计继续延续该思绪。
系统在扫描用户的正脸、左侧脸和右侧脸的照片之后即可直接天生 AI 兼顾,不外为了获得更好的效果,PicPic 激励用户上传 3-8 张正脸无遮挡照片,守候一小时左右可天生兼顾。
在兼顾的天生上,PicPic 比妙鸭相机更利便,在制作妙鸭相机兼顾时用户需要上传 14-50 张多角度、多神色、多光线的照片。
首先,值得一定的是 PicPic 天生的数字兼顾与用户自身的相似度异常高,特征捕捉异常准确,而且不会太过美颜和美化。
然则或许是由于会捕捉到川字纹、法律纹等这些在脸上都不显著的动态纹,以是体验时代偶然会有“一键换脸”的既视感。
而天生兼顾之后,用户主要有三个使用兼顾天生写真的方式:
1、直接使用系统预设的 AI 兼顾模版,现在 PicPic 提供古典艺术、虫晶蝶舞、都会闲步三个预设模板,数目相对较少。
从天生效果来看,每组照片会给出 4 种选择,用户可以从中选择自己感兴趣的一张,如若不知足也可重新天生,照片的气概与预设气概一致,而且乐成概率也对照高。
但也存在天生效果并不稳固的情形,好比虫晶蝶舞的 2 图和 4 图泛起了面部变形、脖子变形的情形;都会闲步四张图片中有三张图片没有手,有手的一张还泛起了多手指、手指扭曲的情形。
相比之下,妙鸭相机的模板选择更为厚实、天生的效果也更为稳固,另外除了通例的模板气概,妙鸭相机还会针对节日和重大流动推出响应模板,好比情人节、妇女节、春日、冬日、圣诞等等,从这点来看,不仅增添用户的可选性,更是提升复购和留存的好方式。
而从模板自己的完成度来看,小我私人以为 PicPic 天生的效果照样更像 AI,但妙鸭相机天生的效果更像是艺术写真,只管有较为显著的美颜和修图处置。
2、通过对主体、环境、气氛和气概的要害词形貌天生想要的兼顾写真,通常需要 4 分钟左右可以天生。
用户可以完全自界说要害词,也可以从系统预设的 AI 灵感标签中直接选择,PicPic 根据将所有要害词分成角色、发型、服装、配饰、动作、美颜、室内、室外、主题、元素、灯光、艺术气概、色调、效果等 14 个种别,不限标签数目。
从天生的效果来看,笔者自界说填写的 2 寸证件照、吊带郁金香、战国袍奔跑照、红色晚制服,四次要害词预设效果均未到达预期,其中最为主要的题泛起在要害词明白错误。
当笔者将提醒词换为英文后,获得的照片相关度会有所提高,但整体的稳固性照样会差一些。
另外,我们注重到或者是暂未攻克“手”的处置难题,在天生的效果中,PicPic 似乎在有意“隐藏手”,要么截掉手的部门、要么自动设定插兜、抱胸等动作,而在难以阻止的露手图片中,手指数目错误、手指比例失衡、枢纽扭曲的情形时常发生。
在使用系统设定的要害词灵感天生标签来看,也同样会泛起要害词明白错误、要害词缺失、手指错误等情形,其中天生的刺猬头图片重新界说“刺猬头”发型。
整体上,使用要害词形貌天生的兼顾效果未到达直接可使用的水平,不外值得一定的是,天生的效果中五官结构较为稳固。
3、直接使用灵感广场感兴趣的照片并使用已经预设好的要害词,一键天生。暂时无法确定灵感广场的要害词是来自用户照样官方,不外使用异常便捷,选择喜欢的照片直接点击使用天生兼顾即可获得同款。这也是现在许多 AI 生图社区的 Remix 功效的简版。
从效果来看,灵感广场的天生效果与 AI 兼顾模板靠近,基本上可以到达看到的效果。
不外当注意细节时,就会发现身体比例失调、眼神乱瞟、手指错误等情形也时常发生。
不外不知道是要害词照样投喂素材的缘故原由,感受审美有点老旧,经常会以为自己穿越回了 21 世纪初...
除了天生这一部门,用户还可以对已经天生的图片举行气概选择和扩图,气概刷新速率异常快,而且完成度较好,扩图则永远在守候...
用户可以为上传的照片选择模板或者设定要害词改变图片原有气概,现在 PicPic 提供传统漫画、3D 角色、赛博朋克、极简蓝白、水彩、经典漫画、黏土、涂鸦风、蒸汽朋克、像素风、温柔漫画、是非铅笔、漫天泡泡、海底天下等 14 种种差其余气概。
为了测试差异气概的完成度和效果,我们选择了近期热播的电视剧《与凤行》的女主赵丽颖和男主林更新照片作为测试工具。
虽然气概对应准确,但似乎人物特征捕捉得并欠好,险些每一张照片都无法看出照片原本的样子,显然这在当前市场中竞争力并不强。
在 PicPic 里,用户还可以通过自界说要害词直接天生照片,PicPic 的优点是天生速率异常高、而且一个形貌会天生多种差异气概供用户参考。
沐瞳成了字节鸡肋
另外,仍然是英文提醒词效果比中文提醒词效果更好,不外要害词明白错误、人物与物品扭曲/错位、运动方式错误、人物数目错误、岁数识别错误、长度/高度错误等问题仍然存在,甚至像是文生图进入民众视野初期会泛起的问题。
不外直接拿 PicPic 与妙鸭相机对比也算不上公正,妙鸭相机已经经由了一段时间的生长和调整,而PicPic 才上线 2 个月,照样要考察厥后续生长。
另外,只管我们前面已经提到 PicPic 可能暂时不需要“扛业绩”,而且当前用户基数也不大、壮大的中台能力让消耗的成本也相对可控,不外从免费兼顾、东南亚市场变现方式来看,想要实现 ROI 转正可能并不容易,这一点是可能需要想在东南亚做 AI 数字写真的创业者连系自身营业和贮备资金做响应的考量。
2、猫箱:AI 剧情互动,陶醉式陪同表达
猫箱,也是字节跳动在外洋测试乐成后带回海内的又一案例,作为一家全球化公司,字节已经习惯性地将统一需求在海内和外洋举行双向验证。
凭证点点数据,2024 年 3 月上线的猫箱(原名话炉)累计获得了来自 App Store 的 5 万次下载,其他应用商铺的数据要稍多一些,各端均在 10 万次以上。
相比之下,更早上线的猫箱外洋版 BagelBell 已经获得了 120 万次下载,主要来自印尼、菲律宾、巴西和马来西亚。而在我们 2 月宣布的文章中 BegelBell 的下载还不足 20 万次,也就是说其在已往的三个月获得了 100 万次新增。
在功效上,猫箱与 BegelBell 差异不大,详细可见《》中对 BegelBell 功效和体验的形貌。
另外,有趣的是虽然市场转变,但受迎接的剧情仍然是恋爱、校园、霸总、狼人、年下,不外猫箱中泛起了更多武侠、宫廷、神话、穿越智能体,这也和海内用户喜欢的题材相契合。
另外,从笔者体验以及用户反馈来看,猫箱中 AI NPC 的“人设”要比 BagelBell 的加倍稳固,甚至能扛过多次重复测试。以笔者测试的一位冷血魔尊为例,当对方示意自己中毒并在彻查缘故原由时,笔者重复“你在干嘛”5 次,对方均给出的差其余回覆和显示,而且生气怒度不停上涨。
另外,相较于 BagelBell,猫箱中声音的设定变得加倍相符 AI NPC 人设,体验感和陶醉感有所增添。
AI 剧情互动领域的介入者越来越多,大厂、社交创业者、AI 创业者都在实验入局,更有趣的是在这个历程中社交和游戏的界限正在逐渐模糊,甚至会有从业者示意“乙女游戏,要小心了”,不外从创业者对话和用户调研效果来看,多模态的互动方式以及加倍稳固的人设可能才是高留存和高变现的要害。
3、河马爱学:AI 时代,字节教育会纷歧样吗?
河马爱学是字节跳动 2024 年 1 月面向海内市场推出的AI教辅平台,综合了文生图、文生文等多项 AI 手艺,提供作业修正、作文指导、解题思绪以及剧情互动等多项服务。
这也是现在字节跳动浮出水面的第二款 AI 教育产物,在白鲸出海前几天的《》文章中提到 Gauth 在外洋拿下了不少 MAU,依附 AI 真人的双轮战略以及厚实的题库,Gauth 拿到了 AI 教育领域的入场券。
而河马爱学,则仍在发育期,由于海内的产物下载涣散在各个应用商铺,我们无法统计准确的下载和活跃数据,但从各个应用商铺显示的下载量来看,似乎仍在早期发育阶段。
河马爱学官方将功效分成问答、学习工具和素养提升三大种别,详细到功效来看,现实上提供作业修正、口算修正、作文修正、语文作文、英语作文等 10 项功效。
用户直接摄影上传作业,系统会对作业举行自动扫描并判断对错,除了单纯的对错,河马爱学还会给出准确谜底、错误缘故原由、改题思绪等,辅助用户矫正错误。
拍题解题的需求在海内已经经由作业帮和小猿答疑(原小猿搜题)的验证,字节也算借着 AI 东风加速向前。
从笔者的测试体验来看,修正准确率较高,而且会凭证用户的年级给出针对性的建议,然则对卷面的整齐度以及拍摄的清晰度有一定要求,卷面较乱或者分区杂乱的情形下可能会泛起误判。但卷面整齐实在是对学生尤其是低年级学生一个不低的要求
河马爱学会凭证用户设置的命题给出作文建议,辅助用户更好理清题意、获得高分。
其中英语作文会在用户填写完成问题后,结适用户当前所在年级给出推荐时态、写作要点和易错点,另外还会给出一些可能用到的单词、词组、句型和例句,辅助用户表达准确然则不会给出范文。
语文作文则加倍仔细,用户除了要设置问题还需设置作文要求的文体和字数,系统会凭证用户设置内容给出问题剖析、立意角度、选材建议、提要建媾和范文。
而且需要验证家长身份后才可检验,充实思量到了孩子可能会直接照搬范文的情形。
相较于以上两个更倾向辅助用户更好地完成作业,文学素养和互动故事更像是辅助用户举行头脑发散和逻辑磨炼。
在文学素养场景下,用户需要先选中想要举行深度领会的古诗,并会在接下来的剧情中饰演一个角色,通过多人、多地探访领会古诗背后的故事,而在领会古诗的历程中用户需要准确回覆 AI NPC 提出的与古诗相关或诗人相关的问题才可举行下一步。当用户回覆错误时,AI NPC 会激励用户再次思索和实验,或者给出提醒。
河马爱学借用了游戏的闯关设定,用户只有在完成与上一个 AI NPC 的互动后才可能遇见下一个 AI NPC,来推动情节继续向宿世长,可以在保持意见意义的基础上,辅助用户在牢固古诗的基础上打开视野、养成探讨的好习惯。
在互动故事场景下,用户需要先选择古诗题材和故事靠山,之后还需要在系统提供的品质中找到所饰演的主角具备的主要品质,并与 AI 一起续写故事完成故事的创作,河马爱学选择的许多是科技、悬疑、奇幻、邪术、冒险题材,可以辅助学生磨炼想象力。
通常情形下,故事在举行至少 5 轮以上的对话后,才可天生下场,因此用户需要凭证设定的目的推导尽可能合理的剧情来推动故事生长,而且凭证用户所选特征差异,历程中会解锁差其余能力,另外还会随同知识科普,在探索竣事后用户可以更详细地领会相关知识。
用户可使用河马爱学举行语音生图、文字生图和头像制作功效,通过举行要害词的设定天生相符自己需要的图片。从体验来看,天生景物和动物的效果,要比天生人的效果显示更好,相较于现在行业天生效率来看,速率照样略慢了一些。
河马爱学将豆包、Cici 的对话互动模式引入平台,用户可以直接以对话的方式领会和学习,从体验来看应该是有举行针对性训练,在举行一些发散性问题思索时,会有意指导用户举行自主思索。
另外,用户在与河马爱学 AI 盐盐互动时可以举行意见意义挑战模式,介入“你画我猜”“21 问猜词”和“情景挑战”,用户需要在划定次数或者划定条件下给出准确谜底或者完成义务即可获获胜利,对照适合学生举行短暂放松和调治。
笔者将该应用安利给了身边三位二年级、六年级和初二学生的家长请他们协助测试,对方示意确实节约了一些基础问题的时间,但面临庞大题型显示不如预期,另外卡顿、加载过慢的情形也时有发生。另外,其中两位低年级学生家长示意,孩子很喜欢互动故事。
只管,关于教育的风向和政策在不停转变,但就现真相形来看,教育仍然是刚需中的刚需,这也是字节跳动为什么会在教育领域拼拼脱手的缘故原由,不知道 Gauth 和河马爱学等 AI 教育产物能否辅助字节跳动获得教育赛道的头部玩家入场券。
整体来看,字节选择了“最火”的 3 条赛道继续推出和迭代新品,来尽可能提升实现 PMF 的乐成率,而在差异赛道的产物里,AI 天生功效又有所交织,来提升能力的有用复用。
对于字节这样的大厂来说,虽然 AI 天生功效依然有些不稳固,但依然是唯快不破。
免责声明:此消息为 正大期货原创或转自合作媒体,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,请自行核实相关内容。文章内容仅供参考,不构成 正大期货投资建议。