چگونه اپل صداي انساني‌تري براي سيري طراحي كرد

۲۵ بازديد

چگونه اپل صداي انساني‌تري براي سيري طراحي كرد

سيري، الكسا، كورتانا، گوگل اسيستنت و ديگر دستيارهاي صوتي مجازي با اينكه هنوز در مراحل ابتدايي تكامل خود به‌ سر مي‌برند، اما امروزه نقش زيادي در زندگي‌ روزمره‌ي ما بازي مي‌كنند. آن‌ها در گوشي‌هاي موبايل ما، اسپيكر‌هاي هوشمند، پلتفرم‌هاي اينترنت اشياء و ... حضور فعالي دارند و انجام امور مختلف را براي ما آسان مي‌كنند. در اين ميان سيري، دستيار صوتي كهنه‌كار اپل در نسخه‌ي بعدي سيستم عامل موبايل اين شركت يعني آي‌اواس ۱۱، با بهبودهاي فراواني به‌روزرساني شده است. سيري جديد تا چند هفته‌ي آينده، به همراه نسخه‌ي نهايي آي‌اواس ۱۱ و آيفون ۸ به‌صورت رسمي در اختيار كاربران قرار خواهد گرفت. به همين مناسبت ديويد پيرس، نويسنده‌ي ستون فناوري وب‌سايت وايرد، به سراغ مديران ارشد اپل و در راس آن‌ها الكس ايسرو رفته و از آن‌ها درباره‌ي رازهاي ناگفته درباره‌ي تكامل سيري پرسش‌هاي قابل تأملي كرده است. حاصل اين پرسش و پاسخ، مقاله‌‌ي ذيل است كه در تاريخ هفتم سپتامبر در وب‌سايت وايرد منتشر شده است.

سيري در برابر سامانتا

هنگامي كه الكس ايسرو براي اولين بار فيلم او (Her) را تماشا كرد، همانند افراد معمولي از ابتدا تا انتها به صفحه‌ي نمايشگر چشم دوخت. اما دفعه‌ي دومي كه وي به مشاهده‌ي اين فيلم پرداخت، در واقع اصلا فيلم را تماشا نكرد. ايسرو، مدير ارشد اپل و مسئول توسعه‌ي دستيار صوتي سيري، روبه‌روي نمايشگر نشست، چشمان خود را بست و به نحوه‌ي صحبت كردن اسكارلت جوهانسون در نقش يك هوش مصنوعي به نام سامانتا گوش سپرد. او به نحوه‌ي برقراري ارتباط متقابل بين سامانتا و تئودور توامبلي با بازي حواكين فينيكس توجه كرد. ايسرو تلاش كرد تا دريابد چه چيزي در مورد سامانتا توانسته است منجر به بروز علاقه‌ي شديد بازيگر نقش اول مرد به وي، بدون ديدنش شود.

هنگامي كه نظر ايسرو را درباره‌ علت موفقيت اين صدا جويا شدم، وي با خنده پاسخ داد زيرا جواب اين سؤال بسيار واضح بود. ايسرو در پاسخ گفت: «صداي او (سامانتا) طبيعي است! صداي او رباتيك نيست!» اين موضوع غير قابل فهمي براي ايسرو نبود. در همين راستا، تأييد شد كه تيم او در اپل، سال‌هاي اخير را صرف انجام يك پروژه‌ كرده است؛ انساني‌تر كردن صداي سيري.

پاييز امسال، زماني كه آي‌اواس ۱۱ براي ميليون‌ها دستگاه آيفون و آيپد در سراسر جهان منتشر شود، اين به‌روزرساني نرم‌افزاري، يك صداي جديد براي سيري به ارمغان خواهد آورد. اين ارتقاء پيش‌ رو، شامل ويژگي‌هاي جديد يا قابليت تعريف لطيفه‌هاي خنده‌دارتر نيست؛ اما تغييرات صورت‌گرفته در سيري براي كاربران قابل درك خواهد بود. سيري اكنون حين اداي جملات مكث بيشتري مي‌كند؛ درست پيش از هر مكث، هجاها را مي‌كشد؛ آهنگ صداي خود را حين صحبت بالا و پايين مي‌برد و واژه‌ها را روان‌تر تلفظ مي‌كند. سيري همچنين قادر به صحبت به زبان‌هاي بيشتري خواهد بود. مجموع اين بهبودها، تعامل با دستيار صوتي اپل را لذت‌‌بخش‌تر خواهد كرد.

اپل سال‌هاي زيادي صرف بازسازي ساختار فناوري سيري و تغيير ماهيت آن از يك دستيار مجازي به يك هوش مصنوعي همه‌كاره و مبتني بر موبايل و قرار دادن آن در اختيار كشورها و زبان‌هاي بيشتري كرده است. سيري با وجود تمام نواقصش، دردسترس‌ترين دستيار صوتي جهان است. تلاش‌هاي اپل به‌منظور در اختيار قرار دادن سيري براي افراد بيشتر، در ابتدا آهسته بود، اما اكنون سرعت بيشتري به خود گرفته است. سيري اكنون تحت نظارت كريگ فدريگي، رئيس بخش نرم‌افزاري اپل قرار دارد اين موضوع نشان‌دهنده‌ي اهميت يافتن اين دستيار صوتي براي اپل در حد سيستم‌عامل ‌آي‌اواس است.

iBrain Apple

فناوري هنوز به آن اندازه پيشرفت نكرده است كه شما را عاشق دستيار مجازي‌تان كند. اما ايسرو و تيم او معتقدند كه با اقدامات خود قدم رو به جلوي بزرگي برداشته‌اند. آن‌ها شديدا بر اين باورند كه اگر موفق به انساني‌تر كردن صداي سيري شوند و آن را شبيه به يك فرد آشنا و قابل اعتماد كنند، حتي در صورت شكست، از سيري يك هوش مصنوعي بي‌نظير خواهند ساخت. اين اقدام، در دوران اوليه‌ي تكامل فناوري هوش مصنوعي مبتني بر صدا، احتمالا بهترين سناريوي ممكن خواهد بود.

سيري تكامل مي‌يابد

اگر يك مثال خوب از علت كنترل اپل بر تمام جنبه‌هاي محصولاتش مي‌خواهيد، كافي است به سيري نگاه كنيد. سيري ۶ سال پس از عرضه‌، در اغلب ويژگي‌ها از ساير رقباي خود عقب مانده است. الكساي آمازون، پشتيباني بيشتري از توسعه‌دهندگان فراهم مي‌كند؛ گوگل اسيستنت چيزهاي بيشتري مي‌داند و هر دوي آن‌ها در دستگاه‌هاي بيشتري كه توسط كمپاني‌هاي مختلف ساخته شده‌اند، قابل دسترسي هستند.

اپل خود را در اين جريان مقصر نمي‌داند. زماني كه سيري براي اولين بار منتشر شد، كمپاني ديگري مسئول فراهم كردن فناوري تشخيص صداي آن بود. بنابراين، تمام تقصيرها متوجه اين كمپاني (شركت نيوانس) است؛ با اين وجود نه اپل و نه نيوانس هرگز همكاري خود را با يكديگر تأييد نكردند. مقصر هركس كه بود، اپل اكنون با خوشحالي مشكلات اوليه‌ي سيري را به گردن نيوانس مي‌اندازد. گرك جوزوياك، نائب‌رئيس بخش بازاريابي اپل؛ مي‌گويد:

اين موضوع مثل اين مي‌ماند كه با پشتيباني شخص ديگري در يك رقابت شركت كنيد... اپل هميشه برنامه‌هاي بزرگي براي سيري در سر داشت. ما در فكر اين بوديم كه دستياري بسازيم تا بتوانيد به‌وسيله‌ي گوشي خود با آن صحبت كنيد و با استفاده از آن كارهاي خود را به نحو ساده‌تري به انجام برسانيد. اما در آن زمان، فناوري هنوز پيشرفت لازم را پيدا نكرده بود. زماني كه ورودي مناسب در اختيار نداشته باشيد، خروجي شما نيز بي‌مصرف خواهد بود.

چند سال پيش، تيم تحت نظارت ايسرو در اپل، در رأس پشتيباني از سيري قرار گرفت و در تجربه‌ي استفاده از اين دستيار مجازي، يك اصلاح اساسي به وجود آورد. سيري اكنون بر اساس يادگيري عميق و هوش مصنوعي توسعه مي‌يابد. در نتيجه‌ي اين اقدام، تغييرات و بهبود‌هاي گسترده‌اي به وجود آمده است. تشخيص خام صداي سيري اكنون با امكان تشخيص صحيح ۹۵ درصد از صحبت‌هاي كاربر، اين دستيار مجازي را در كنار تمام رقباي خود قرار داده است. هوش مصنوعي اكنون در دو بخش مجزا و حياتي از سيستم عمل مي‌كند. اول، گفتار به متن؛ به معني تلاش سيري براي درك صحبت‌هاي كاربر و دوم، متن به گفتار؛ به معني تلاش سيري براي پاسخگويي به كاربر.

از آنجايي كه شخصي‌سازي دستيار‌هاي مجازي به تدريج گسترده‌تر مي‌شود، يكي از مهم‌ترين وظايف سيري، تشخيص صداي شما از بين ديگر صداها است. هرچه قدر سيري داده‌هاي بيشتري در اختيار داشته باشد و هر چه قدر الگوهاي اپل تكامل بيشتري پيدا كنند، امكان تمايز بيشتر افراد از يكديگر و حتي درك لهجه‌هاي غليظ‌تر فراهم مي‌شود. اين موضوع همچنين يك مسئله‌ي امنيتي نيز محسوب مي‌شود. محققان اخيرا دريافته‌اند كه با استفاده از فركانس‌هاي بسيار بالا و غير قابل شنيدن براي انسان، مي‌توانند با سيري ارتباط برقرار كنند و عمليات هك را به‌صورت نامحسوس انجام دهند. سيري بايد ياد بگيرد بين صداي انسان و صداي ماشين و بين صداي شما و افراد ديگر تمايز قايل شود.

آموختن صحبت كردن

يكي از راه‌هاي كاربردي براي درك نحوه‌ي فعاليت سيستم‌هاي دستيارهاي صوتي، نگاه به فرآيند آموختن يك زبان جديد به سيري توسط اپل است. زماني كه اپل، سيري را براي يك بازار جديد – براي مثال زبان شانگهايي - عرضه مي‌كند، تيم پشتيباني در ابتدا پايگاه داده‌هاي موجود مربوط به آن زبان محلي را پيدا مي‌كند. در ادامه آن‌ها افراد متخصصي را با زبان محلي استخدام مي‌كنند و از آن‌ها مي‌خواهند تا كتاب، روزنامه، مقاله‌هاي اينترنتي و ... بخوانند.

تيم اپل از صداهاي ضبط‌شده رونوشت تهيه مي‌كند و واژه‌ها را با صداها تطبيق مي‌دهد و مهم‌تر از همه واج‌ها، يعني كوچك‌ترين واحد آوايي مستقل كه تمام گفتار را شامل مي‌شوند مشخص مي‌كند. در زبان انگليسي، fourteen (عدد چهارده) يك واژه است و حرف صدادار e يك واج به حساب مي‌آيد. آن‌ها تلاش مي‌كنند اين واج‌هاي اداشده را به هر صورت ممكن ثبت كنند؛ زيرا محو شدن واج در انتهاي واژه، از ابتداي آن شديدتر و پيش از هر مكث بلندتر است و در يك جمله‌ي سؤالي نيز اوج مي‌گيرد. هر گفتار، يك موج صوتي تقريبا متفاوت دارد و الگوريتم‌هاي اپل با تحليل‌هاي مختلف، مناسب‌ترين موج صوتي را براي هر جمله‌ي مورد نظر پيدا مي‌كنند. هر جمله‌اي كه سيري ادا مي‌كند شامل ده‌ها يا صدها واج مختلف است كه همانند برش‌هاي يك مجله و با شكل‌هاي مختلف با يكديگر تركيب شده‌اند. احتمالا هيچ كدام از اين واژه‌هايي كه از زبان سيري مي‌شنويد، دقيقا به همان شكلي كه در ابتدا ضبط‌ شده‌اند نيستند.

Siri

ايسرو در اين باره يك مثال مطرح مي‌كند. بيايد جمله‌ي «آيا مي‌خواهي اين را تماشا (Watch) كني؟» با جمله‌ي «من ساعت (Watch) تو را دوست دارم.» مقايسه كنيم. در حالت اول، زماني كه ايسرو واژه‌ي واچ را تلفظ مي‌كند، صداي او رو به بالا، اما در حالت دوم رو به پايين مي‌رود. ايسرو مي‌گويد: «در هر دو جمله يك واژه‌ي يكسان به كار مي‌رود؛ اما تلفظ آن‌ها كاملا با يكديگر متفاوت است.» او نمي‌توانست از همان صداي ضبط‌شده‌ي واژه‌ي واچ يا حتي همان واج‌هاي اختصاصي در دو جمله استفاده كند؛ زيرا گوش دادن بي‌وقفه به سيستم‌هايي همانند مسيرياب‌هاي قديمي جي‌پي‌اس كه واژه‌ها را به‌صورت كشيده و با فشار بالا تلفظ مي‌كنند، دشوار و ناخوشايند است.

حتي تا همين چند سال گذشته، قدرت پردازش كامپيوترها و سرورها به اندازه‌اي نبود كه يك پايگاه داده‌ي بزرگ را بررسي و بهترين تركيب صداها را براي هر تماس و پاسخ پيدا كنند. اما اكنون آن‌ها قادر به انجام اين كار هستند و ايسرو و تيم او نيز خواهان بيشترين مقدار داده‌ي ممكن هستند. در نتيجه، هنگامي كه آن‌ها يك الگوي ابتدايي بسازند، سيري را در حالتي به نام «ديكته‌ي صرف» منتشر مي‌كنند. شما نمي‌توانيد با سيري صحبت كنيد؛ اما مي‌توانيد با فشردن دكمه‌ي ميكروفون يك پيام متني يا جستجوي اينترنتي به او ديكته كنيد. اين امكان، ورودي‌هايي از لهجه‌هاي مختلف با كيفيت متفاوت از ميكروفون و موقعيت‌هاي متنوع براي ماشين‌هاي اپل فراهم مي‌كند و منجر به اين مي‌شود تا عملكرد سيري براي افراد بيشتري بهبود يابد. اپل بنا به ادعاي خود، به‌صورت ناشناس اين داده‌ها را جمع‌آوري و رونويسي مي‌كند و با اين كار الگوريتم‌ها را بهبود مي‌بخشد و شبكه‌ها را آموزش مي‌دهد. آن‌ها در ادامه، داده‌هاي مكاني و تفاوت‌هاي گفتاري را اضافه مي‌كنند. براي مثال برتري سه بر صفر يك تيم در مسابقه‌ي فوتبال در آمريكا به‌صورت three-zero و در بريتانيا به‌صورت three-nil بيان مي‌شود. آن‌ها سپس به پالايش سيستم ادامه مي‌دهند تا سرانجام سيري به درك تقريبا بي‌نقصي از واژه‌هاي زبان شانگهايي و نحوه‌ي تلفظ آن‌ها توسط مردم دست پيدا كند.

در همين زمان، اپل براي يافتن بهترين صداي موجود، شروع به راه‌اندازي يك جستجوي تمام‌عيار مي‌كند. بدين منظور، آن‌ها كار خود را با صدها نفر آغاز و اقدام به ضبط نمونه‌هاي مختلف از جمله‌هاي احتمالي براي سيري مي‌كنند. ايسرو سپس با همكاري با طراحان اپل و تيم رابط كاربري، بهترين صداها را انتخاب مي‌كند. اين قسمت كار بيش از آنكه علمي باشد، ماهيتي هنرمندانه دارد. در اينجا، آن‌ها شروع به گوش دادن به برخي از احساسات غير قابل وصف، خالصانه و غير مصنوعي انساني مي‌كنند.

اما قسمت بعدي، يك كار كاملا علمي است. ايسرو مي‌گويد: «صداهاي مناسب بسيار زيادي وجود دارد؛ اما اين بدين مفهوم نيست كه همه‌ي آن‌ها يك صداي متن به گفتار مناسب خواهند بود.» آن‌ها شروع به اجراي گفتارها از طريق الگوهايي كه ساخته‌اند و يافتن تغيير پذيري واج‌ها، به‌خصوص تفاوت موج صوتي بين سمت چپ و راست هر عبارت كوچك مي‌كنند. تغييرپذيري بيشتر بين يك واج، تركيب تعداد زياد آن‌ها را در يكديگر و در حالت صوت طبيعي دشوار مي‌كند. اما شما هرگز هيچ مشكلي در شنيدن آن صحبت‌ها نخواهيد داشت و تنها كامپيوتر قادر به درك اين تفاوت خواهد بود. ايسرو مي‌گويد: «اين كار تقريبا مثل زماني است كه شما مشغول چسباندن كاغذديواري هستيد و در اين حين، بايد حواستان به درز‌ها باشد تا مطمئن شويد همه‌ي آن‌ها با يكديگر هم‌تراز هستند.»

هنگامي كه آن‌ها از بين صداهاي مختلف، صداي مناسب انسان و كامپيوتر را يافتند، در هر بار، آن‌ را براي هفته‌ها ضبط مي‌كنند. آن صدا سرانجام به صداي سيري تبديل خواهد شد. اين مراحل، فرآيند يافتن صداي مناسب را براي ۲۱ زبان تحت پشتيباني سيري و بومي‌سازي آن‌ها براي ۳۶ كشور، يعني بيش از مجموع تمام رقباي اصلي‌اش شامل مي‌شود. در مجموع، ماهيانه ۳۷۵ ميليون نفر از سيري استفاده مي‌كنند. اين عدد، به‌خصوص براي يك دستيار صوتي با فهرستي بلندبالا از كمبودهاي قابل توجه، رقم بسيار بالايي محسوب مي‌شود.

با اين حال، ۳۷۵ ميليون نفر در سرتاسر جهان از محصولات متنوع اپل استفاده مي‌كنند. سيري تقريبا از طريق تمام محصولات اپل، از آيفون تا اپل واچ، تا مك‌بوك و اپل تي‌وي، قابل دسترس است. تحليلگران پيش‌بيني مي‌كنند كه به‌زودي بيش از يك ميليارد دستگاه آيفون، در يك زمان با هم فعال خواهند شد. سيري يك قابليت محبوب و مهم است؛ اما تقريبا در همه جا قابل دسترسي نيست و قطعا براي اغلب افراد نيز ضروري محسوب نمي‌شود. شما براي استفاده از گوشي خود به شيوه‌ي مورد نيازتان، احتياجي به سيري نداريد. در نتيجه اكنون كه اپل يك دستيار قابل اطمينان دارد، بايد به مردم نحوه‌ي استفاده از آن را آموزش دهد.

همه چيز را از من بپرس

تمام آنچه كه لازم است درباره‌ي برنامه‌هاي اپل براي سيري بدانيد، از طريق ويدئوي تبليغاتي زير قابل مشاهده است. اين آگهي تبليغاتي، يك روز معمولي از زندگي دواين جانسون، بازيگر هاليوودي را به همراه دستيار و دوست نزديكش نشان مي‌دهد. جانسون درحالي‌كه مشغول ورزش و هرس كردن گلدانش است، با استفاده از سيري تقويم گوشي را اجرا و يادآوري‌هايش را بررسي مي‌كند. سپس با استفاده از اپليكيشن ليفت، يك تاكسي سفارش مي‌دهد و خودش مشغول رانندگي مي‌شود و درحالي‌كه با بي‌ملاحظگي سرعت مي‌گيرد، وضعيت آب و هوا را بررسي مي‌كند. جانسون در صحنه‌‌ي بعدي درحالي‌كه مشغول نقاشي ديوار كليساي سيستين در رم است، ايميل خود را چك مي‌كند و درحالي‌كه مشغول انجام كارش است، مكالمات كوتاهي برقرار مي‌كند. وي در نهايت با استفاده از اپليكيشن فيس‌تايمز در فضا از خود سلفي مي‌گيرد و بابت تمام خدمات سيري از او تشكر مي‌كند؛ سيري نيز در پاسخ، با لحني ناخوشايند او را آقاي بزرگ، كچل و زيبا خطاب مي‌كند. در صورتي كه سيري در آي‌اواس ۱۱ به اين شيوه صحبت كند، قطعا احساس بدي به ما دست خواهد داد.

 

از همان ابتداي مصاحبه، جوزوياك اعلام مي‌كند كه اپل قصد دارد سيري را به يك دستگاه همه‌كاره و كاربردي تبديل كند. اينكه كاربران، اغلب دستيارهاي را صوتي بر اساس پرسيدن سؤال‌هاي بي‌اهميت با يكديگر مقايسه مي‌كنند، جوزوياك را عصباني مي‌كند. سيري هميشه در اين رقابت‌ها به نسبت ضعيف ظاهر مي‌شود. جوزوياك مي‌گويد» «ما اين چيز (سيري) را با اين هدف طراحي نكرديم كه پاسخگوي سؤالات بي‌معني باشد!»

در عوض، جوزوياك همچنان توجه خود را به آگاهي‌رساني به مردم و تشويق آن‌ها به استفاده‌ي بيشتر از دوست ماشيني‌شان معطوف كرده است. وي به قابليت سيري در انجام جستجوي پيچيده‌ي فايلي در مك يا آگاهي عميق محصول پيش‌روي هوم‌پاد از موسيقي‌ها اشاره مي‌كند. چند روز پس از ملاقات ما، زماني كه سيري يك جايزه‌ي فني امي براي كنترل و جستجوي صوتي برنده شد، مثال ديگري نيز مطرح شد. در حال حاضر سيري مي‌تواند آهنگ‌هاي شما را به عقب يا جلو ببرد. كافي است عبارت «هي سيري، دو دقيقه به عقب بازگرد» را بيان كنيد و از نتيجه‌ي شگفت‌انگيز آن لذت ببريد.

با وجود تمام اين مثال‌‌ها، سيري قادر به انجام تمام كارها يا حتي اغلب كارها نيست. بيشترين كاربرد اين دستيار صوتي، صرفه‌جويي در وقت با كاهش تعداد تپ‌ها و ميزان تايپ كردن‌ است و نه پاسخ دادن به سؤالات پيچيده‌ي بي‌اهميت يا بحث كردن با كاربر. با اين حال، از آنجايي كه سيري ظاهرا هيچ محدوديتي ندارد، مي‌توانيد هر سؤالي از او بپرسيد. ايسرو مي‌گويد: «اينكه كاربران بدانند قادر به گفتن چه چيزهايي هستند، براي آن‌ها اهميت دارد.» بخشي از وظيفه‌ي ايسرو، ياري رساندن به سيري در به كار بردن مناسب‌تر مهارت‌هايش و شكست بدون ترس در زمان لازم است. ايسرو مي‌گويد: «ما تلاش مي‌كنيم چنين قابليت‌هايي را به سيري اعطا كنيم تا بداند آنچه را كه نمي‌داند. اما اين مسئله، موضوع دشواري است.» وب‌سايت اپل و حتي ‌آگهي‌هاي تبليغاتي اين شركت به شيوه‌اي طراحي شده‌اند تا درك مردم را دربا‌ره‌ي توانايي‌ها و ضعف‌هاي سيري به‌طور همزمان افزايش دهند.

چالش بعدي، ياد‌آوري به مردم درباره‌ي وجود سيري است. ايسرو مي‌گويد مردم در انجام امور، عادت‌هاي خود را دارند. اگر آن‌ها به تايپ كردن عادت كرده‌اند، تغيير اين عادت نيازمند زمان است. در نتيجه اپل تلاش مي‌كند به تدريج مردم را به مسير درست هدايت كند. در آي‌اواس ۱۱، سيري حضور بسيار بيشتري دارد و بيش از پيش فعال است. او بر وب‌گردي شما نظارت مي‌كند، سپس اخبار اپل نيوز را به شما پيشنهاد مي‌دهد يا به شما كمك مي‌كند در مواقع لازم يك رويداد را به تقويم اضافه كنيد. سيري جديد يك دستيار صوتي انعطاف‌پذير است. اهميتي ندارد كه از چه گجتي استفاده مي‌كنيد؛ سيري تنظيمات شما را بين دستگاه‌هاي مختلف همگام‌سازي مي‌كند. سيري مثل هميشه به‌خوبي شما را مي‌شناسد.

در طول سال‌ها، اپل در فراهم كردن امكان سازگاري توسعه‌دهندگان با سيري، سرعت عمل مناسبي نداشته است. درحالي‌كه آمازون و گوگل، توسعه‌دهندگان را به طراحي اپليكيشن براي دستيارهاي مجازي‌شان، الكسا و گوگل اسيستنت تشويق كرده‌اند، درهاي اپل تاكنون به روي سازندگان اپليكيشن بسته بوده است. سيري، تمام آن كارهايي را كه رقبا قادر به انجامشان هستند، تنها مي‌تواند در اپليكيشن‌هاي اختصاصي اپل انجام دهد. سيري وجود اپليكيشن‌هايي نظير نقشه‌هاي گوگل يا اوت‌لوك را روي گوشي شما انكار مي‌كند. سيري همچنين بدون هوم كيت (پلتفرم اينترنت اشياء اپل) قادر به روشن كردن هيچ لامپي نخواهد بود. سال گذشته، اپل به‌صورت محتاطانه، دسترسي لازم را براي توسعه‌دهندگان بيشتري فراهم كرد و به كاربران اجازه داد با استفاده از سيري تماس صوتي واتساپ برقرار كنند، با اوبر تاكسي سفارش دهند و با كيف پول مجازي Venmo پول ارسال كنند. در حال حاضر در آي‌اواس ۱۱، اين دسترسي تاحدودي بيشتر شده است.

Siri

از آنجايي كه آمازون و گوگل پشتيباني از توسعه‌دهندگان را به سرعت گسترش مي‌دهند و قابليت‌هاي بيشتري به دستيارهاي صوتي‌شان اضافه مي‌كنند، چنين حركت‌هاي آهسته‌اي از سوي اپل منجر به تغيير نگاه عموم به اين شركت مي‌شود. با اين وجود، جوزوياك به سياست‌هاي اپل اطمينان دارد. به باور او، پرسش اصلي اين نيست كه تعداد كارهاي قابل انجام با سيري چقدر است؛ بلكه مسئله‌ي اصلي اين است كه سيري چگونه آن كارها را به نحو مناسب انجام مي‌دهد. زيرا آنچه ما تمايل به انجام آن نداريم دست و پاگير مي‌شود. جوزوياك، جمله‌‌شناسي درخواست‌هاي مطرح‌شده با الكسا و گوگل اسيستنت را مناسب نمي‌داند؛ درخواست‌هايي نظير «الكسا، از طالع‌بيني ديلي هوروسكوپس در مورد برج گاو سؤال كن» يا «اوكي گوگل، اجازه بده با اپليكيشن Todoist صحبت كنم،» از نظر جوزوياك نامناسب هستند. او ترجيح مي‌دهد دستيار صوتي آن‌ها تا زماني كه شما خواسته‌ي خود و چگونگي و نحوه‌ي انجام آن را درخواست مي‌كنيد صبر كند. اپل مثل هميشه ترجيح مي‌ده به جاي انجام نصف و نيمه‌ي كاري، آن را اصلا انجام ندهد.

مشكل جمله‌شناسي در نهايت به همان نحوه‌ي صحبت كردن سامانتا كه منجر به بروز احساسات عميق بين او و تئودور شده بود بازمي‌گردد. ايسرو مي‌گويد صداي بهترين كامپيوترها، حتي نمونه‌هاي موجود در فيلم‌هاي علمي تخيلي، شبيه انسان است؛ يعني مكث‌هاي مناسب، تلفظ مناسب و صداي رواني دارند و در صحبت كردن آن‌ها، تنها كمي ته‌صداي رباتيك به گوش مي‌رسد. او مي‌خواهد چيزي بسازد كه مناسب باشد و آن را در اختيار همه قرار دهد تا هر زمان كه قصد انجام كاري داشتند، تنها به سيري مراجعه كنند.

تا كنون نظري ثبت نشده است
ارسال نظر آزاد است، اما اگر قبلا در مونوبلاگ ثبت نام کرده اید می توانید ابتدا وارد شوید.