我被面粉逼急了,才发现的隐藏功能
我这个人,以前对那些语音助手、语音识别的功能,一直觉得是鸡肋。你问一句,它答一句,但凡你语气变了点,或者想连着问第二个问题,它就马上懵圈。所以“百度听”这东西,我安装了快半年都没正眼瞧过。
我为啥突然开始研究这玩意儿?说来话长,上个月我迷上了做手工面包。大家都知道,做面包这事儿,手上那叫一个脏乱差。面粉、水、酵母,黏糊糊的,手机扔桌上,你根本不敢碰。但揉面的时候,你又需要不断地计时,查一下下一步要放多少克黄油,手机屏幕简直就是我的“禁区”。
当时我是彻底抓狂了,手上全是面团,又急着要查一个发酵温度。我对着手机吼了一句:“百度,帮我查一下今天室温多少!” 结果它还真启动了,但查完之后,就安静了。我心里骂了一句,还得等手干净了再开计时器。就在我准备放弃的时候,我随手点开了它的设置。
从“单线程”到“连续对话”的跨越
我当时纯粹是抱着“死马当活马医”的心态,翻遍了所有的设置项。你知道吗?就在那个不起眼的“通用设置”下面,我发现了一个以前从来没注意过的开关——“连续对话模式”。我心里嘀咕,这玩意儿能有多大用?但还是把它打开了。
这一开,简直是捅了马蜂窝,完全是两个产品了!
我赶紧擦干净手,回到厨房,重新试了一遍。我这回直接扔了一串指令过去,连停顿都没有:
- “百度,帮我设置一个三十分钟的计时”
- “把计时器声音调到最大”
- “对了,播放一个安静的古典乐”
以前它只会执行第一个命令,然后就“休眠”了。但这回它连贯地执行了所有操作!计时器开了,音乐也响了,中间没有需要我重复喊“百度”来唤醒。这不就是我需要的“解放双手”吗?我当时那个激动,感觉发现了新大陆。
隐藏玩法:语音结合图像的作弊级操作
既然发现了连续对话的甜头,我当然要继续深挖它还有什么“旁门左道”的玩法。
我试验了一下它的多模态功能,就是语音和图像结合起来用。这功能藏得比较深,你需要先在语音模式下说出“我要拍一张照片”,或者“帮我识别一下”。
有一次我在看一个国外的烹饪视频,里面有段配料表是外文,我暂停了视频,手忙脚乱想截图翻译。但这时候,我突然想起了这个隐藏功能。我直接对着手机喊:
“百度,帮我识别一下屏幕上的外文,然后告诉我最关键的三个词是什么意思!”
手机立刻截图识别,然后在几秒钟内,直接用人声朗读出那几个关键配料的中文意思。天呐,这个效率简直是开挂了!它不是机械地翻译,而是提取了关键信息直接告诉我,省去了我一个个去看翻译结果的步骤。
现在我出门,遇到不认识的花草、复杂的路牌,或者手边拿着说明书,我都是用这种方式:语音触发拍照 -> 连续语音提问。它成功地从一个简单的语音工具,变成了我的随身速记和翻译官。当初要不是被那堆面粉逼得没办法,我真不知道它有这么好用!我现在出门必备的就是打开这个连续对话模式,简直爱不释手。
