பயன்பாடுகளின் எண்ணிக்கை மற்றும் குரல் இடைமுகங்களின் முக்கியத்துவம் வேகமாக வளர்ந்து வருகிறது
உள்ளடக்கம்
போர்ட்லேண்ட், ஓரிகானில் உள்ள ஒரு அமெரிக்க குடும்பம் சமீபத்தில் அலெக்ஸின் குரல் உதவியாளர் அவர்களின் தனிப்பட்ட அரட்டைகளைப் பதிவுசெய்து ஒரு நண்பருக்கு அனுப்பியதை அறிந்தனர். மீடியாவால் டேனியல் என்று அழைக்கப்படும் வீட்டின் உரிமையாளர், செய்தியாளர்களிடம் "அந்த சாதனத்தை மீண்டும் இணைக்க மாட்டேன், ஏனெனில் அவளை நம்ப முடியாது" என்று கூறினார்.
அலெக்சா, Echo (1) ஸ்பீக்கர்கள் மற்றும் பிற கேஜெட்கள் மூலம் பல மில்லியன் அமெரிக்க வீடுகளில் வழங்கப்படுகிறது, அதன் பெயர் அல்லது பயனர் பேசும் "அழைப்பு வார்த்தை" கேட்கும் போது பதிவு செய்யத் தொடங்குகிறது. அதாவது டிவி விளம்பரத்தில் "அலெக்சா" என்ற வார்த்தை குறிப்பிடப்பட்டாலும், சாதனம் பதிவு செய்யத் தொடங்கலாம். இந்த விஷயத்தில் அதுதான் நடந்தது என்கிறார் ஹார்டுவேர் விநியோகஸ்தர் அமேசான்.
"மீதமுள்ள உரையாடல் ஒரு செய்தியை அனுப்புவதற்கான கட்டளையாக குரல் உதவியாளரால் விளக்கப்பட்டது" என்று நிறுவனம் ஒரு அறிக்கையில் தெரிவித்துள்ளது. "ஒரு கட்டத்தில், அலெக்சா சத்தமாக கேட்டார்: "யாரிடம்?" கடினத் தளத்தைப் பற்றிய குடும்ப உரையாடலின் தொடர்ச்சியானது வாடிக்கையாளரின் தொடர்பு பட்டியலில் உள்ள ஒரு பொருளாக இயந்திரத்தால் உணரப்பட்டிருக்க வேண்டும். குறைந்தபட்சம் அமேசான் அப்படித்தான் நினைக்கிறது. இதனால், தொடர் விபத்துக்களாக மொழி பெயர்ப்பு குறைந்துள்ளது.
இருப்பினும் பதட்டம் நீடிக்கிறது. ஏனென்றால், சில காரணங்களால், நாங்கள் இன்னும் நிம்மதியாக உணர்ந்த ஒரு வீட்டில், நாம் ஒருவித "குரல் பயன்முறையில்" நுழைய வேண்டும், நாம் என்ன சொல்கிறோம், டிவி என்ன ஒளிபரப்புகிறது மற்றும், நிச்சயமாக, இந்த புதிய ஸ்பீக்கர் என்ன மார்பில் உள்ளது இழுப்பறை கூறுகிறது . எங்களுக்கு.
எனினும், தொழில்நுட்ப குறைபாடுகள் மற்றும் தனியுரிமை கவலைகள் இருந்தபோதிலும், அமேசான் எக்கோ போன்ற சாதனங்களின் புகழ் அதிகரித்து வருவதால், மக்கள் தங்கள் குரலைப் பயன்படுத்தி கணினிகளுடன் தொடர்புகொள்வதைப் பயன்படுத்தத் தொடங்கியுள்ளனர்..
அமேசானின் CTO, வெர்னர் வோகல்ஸ், 2017 இன் பிற்பகுதியில் தனது AWS re:Invent அமர்வின் போது குறிப்பிட்டது போல், தொழில்நுட்பம் இதுவரை கணினிகளுடன் தொடர்பு கொள்ளும் திறனைக் கட்டுப்படுத்தியுள்ளது. விசைப்பலகையைப் பயன்படுத்தி Google இல் முக்கிய வார்த்தைகளைத் தட்டச்சு செய்கிறோம், ஏனெனில் இது கணினியில் தகவலை உள்ளிடுவதற்கான மிகவும் பொதுவான மற்றும் எளிதான வழியாகும்.
வோகல்ஸ் கூறினார். –
பெரிய நான்கு
கூகுள் தேடுபொறியை தொலைபேசியில் பயன்படுத்தும்போது, நீண்ட நாட்களுக்கு முன்பு பேசுவதற்கான அழைப்பைக் கொண்ட மைக்ரோஃபோன் அடையாளத்தை நாம் கவனித்திருக்கலாம். இது கூகிள் இப்போது (2), இது ஒரு தேடல் வினவலை கட்டளையிடவும், குரல் மூலம் செய்தியை உள்ளிடவும் பயன்படுகிறது. சமீபத்திய ஆண்டுகளில், கூகுள், ஆப்பிள் மற்றும் அமேசான் ஆகியவை பெரிதும் மேம்பட்டுள்ளன. குரல் அங்கீகார தொழில்நுட்பம். அலெக்சா, சிரி மற்றும் கூகுள் அசிஸ்டண்ட் போன்ற குரல் உதவியாளர்கள் உங்கள் குரலைப் பதிவு செய்வது மட்டுமல்லாமல், அவர்களிடம் நீங்கள் என்ன சொல்கிறீர்கள் என்பதைப் புரிந்துகொண்டு கேள்விகளுக்கு பதிலளிக்கவும்.
அனைத்து ஆண்ட்ராய்டு பயனர்களுக்கும் Google Now இலவசமாகக் கிடைக்கிறது. பயன்பாடு, எடுத்துக்காட்டாக, அலாரத்தை அமைக்கலாம், வானிலை முன்னறிவிப்பைச் சரிபார்த்து, Google வரைபடத்தில் வழியைச் சரிபார்க்கலாம். Google Now இன் உரையாடல் நீட்டிப்பு கூறுகிறது Google உதவியாளர் () - உபகரணங்கள் பயனருக்கு மெய்நிகர் உதவி. இது முக்கியமாக மொபைல் மற்றும் ஸ்மார்ட் ஹோம் சாதனங்களில் கிடைக்கிறது. கூகுள் நவ் போலல்லாமல், இது இருவழி தகவல்தொடர்புகளில் ஈடுபடலாம். அசிஸ்டண்ட் மே 2016 இல் Google இன் Allo மெசேஜிங் பயன்பாட்டின் ஒரு பகுதியாகவும், Google Home வாய்ஸ் ஸ்பீக்கராகவும் (3) அறிமுகமானது.
3. கூகுள் ஹோம்
IOS அமைப்பு அதன் சொந்த மெய்நிகர் உதவியாளரையும் கொண்டுள்ளது. ஸ்ரீ, இது ஆப்பிளின் இயக்க முறைமைகளான iOS, watchOS, tvOS homepod மற்றும் macOS ஆகியவற்றுடன் சேர்க்கப்பட்ட ஒரு நிரலாகும். அக்டோபர் 5 இல் லெட்ஸ் டாக் ஐபோன் மாநாட்டில் iOS 4 மற்றும் iPhone 2011s உடன் Siri அறிமுகமானது.
மென்பொருள் உரையாடல் இடைமுகத்தை அடிப்படையாகக் கொண்டது: இது பயனரின் இயல்பான பேச்சை அங்கீகரிக்கிறது (iOS 11 உடன் கட்டளைகளை கைமுறையாக உள்ளிடவும் முடியும்), கேள்விகளுக்கு பதிலளிக்கிறது மற்றும் பணிகளை முடிக்கிறது. இயந்திர கற்றல் அறிமுகத்திற்கு நன்றி, காலப்போக்கில் உதவியாளர் தனிப்பட்ட விருப்பங்களை பகுப்பாய்வு செய்கிறது பயனர் மிகவும் பொருத்தமான முடிவுகள் மற்றும் பரிந்துரைகளை வழங்க வேண்டும். Siriக்கு நிலையான இணைய இணைப்பு தேவை - Bing மற்றும் Wolfram Alpha ஆகியவை இங்குள்ள தகவல்களின் முக்கிய ஆதாரங்கள். மூன்றாம் தரப்பு நீட்டிப்புகளுக்கான ஆதரவை iOS 10 அறிமுகப்படுத்தியது.
பெரிய நான்கில் மற்றொன்று கோர்டானா. இது மைக்ரோசாப்ட் உருவாக்கிய அறிவார்ந்த தனிப்பட்ட உதவியாளர். இது Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, Android மற்றும் iOS இயங்குதளங்களில் ஆதரிக்கப்படுகிறது. Cortana முதன்முதலில் ஏப்ரல் 2014 இல் சான் பிரான்சிஸ்கோவில் மைக்ரோசாப்ட் பில்ட் டெவலப்பர் மாநாட்டில் அறிமுகப்படுத்தப்பட்டது. நிரலின் பெயர் ஹாலோ கேம் தொடரின் ஒரு கதாபாத்திரத்தின் பெயரிலிருந்து வந்தது. Cortana ஆங்கிலம், இத்தாலியன், ஸ்பானிஷ், பிரஞ்சு, ஜெர்மன், சீனம் மற்றும் ஜப்பானிய மொழிகளில் கிடைக்கிறது.
ஏற்கனவே குறிப்பிட்டுள்ள நிரலின் பயனர்கள் அலெக்சா அவர்கள் மொழி கட்டுப்பாடுகளையும் கருத்தில் கொள்ள வேண்டும் - டிஜிட்டல் உதவியாளர் ஆங்கிலம், ஜெர்மன், பிரஞ்சு மற்றும் ஜப்பானிய மொழிகளை மட்டுமே பேசுவார்.
Amazon Virtual Assistant முதலில் Amazon Lab126 ஆல் உருவாக்கப்பட்ட Amazon Echo மற்றும் Amazon Echo Dot ஸ்மார்ட் ஸ்பீக்கர்களில் பயன்படுத்தப்பட்டது. இது குரல் தொடர்பு, இசை இயக்கம், செய்ய வேண்டிய பட்டியல் உருவாக்கம், அலாரம் அமைப்பு, போட்காஸ்ட் ஸ்ட்ரீமிங், ஆடியோபுக் பிளேபேக் மற்றும் நிகழ்நேர வானிலை, போக்குவரத்து, விளையாட்டு மற்றும் செய்தி (4) போன்ற பிற செய்தித் தகவல்களை செயல்படுத்துகிறது. வீட்டு ஆட்டோமேஷன் அமைப்பை உருவாக்க அலெக்சா பல ஸ்மார்ட் சாதனங்களைக் கட்டுப்படுத்த முடியும். அமேசான் கடையில் வசதியான ஷாப்பிங் செய்ய இதைப் பயன்படுத்தலாம்.
4. பயனர்கள் எக்கோவை எதற்காகப் பயன்படுத்துகிறார்கள் (ஆராய்ச்சியின் படி)
பயனர்கள் அலெக்சா "திறன்கள்" (), மூன்றாம் தரப்பினரால் உருவாக்கப்பட்ட கூடுதல் அம்சங்களை நிறுவுவதன் மூலம் அலெக்சா அனுபவத்தை மேம்படுத்தலாம், பொதுவாக மற்ற அமைப்புகளில் வானிலை மற்றும் ஆடியோ புரோகிராம்கள் போன்ற பயன்பாடுகள் என குறிப்பிடப்படுகிறது. பெரும்பாலான அலெக்சா சாதனங்கள் உங்கள் மெய்நிகர் உதவியாளரை விழித்தெழுதல் கடவுச்சொல் மூலம் செயல்படுத்த அனுமதிக்கின்றன.
இன்று (5) ஸ்மார்ட் ஸ்பீக்கர் சந்தையில் Amazon நிச்சயமாக ஆதிக்கம் செலுத்துகிறது. மார்ச் 2018 இல் புதிய சேவையை அறிமுகப்படுத்திய IBM, முதல் நான்கு இடங்களுக்குள் நுழைய முயற்சிக்கிறது வாட்சனின் உதவியாளர், குரல் கட்டுப்பாட்டுடன் கூடிய மெய்நிகர் உதவியாளர்களின் சொந்த அமைப்புகளை உருவாக்க விரும்பும் நிறுவனங்களுக்காக வடிவமைக்கப்பட்டுள்ளது. ஐபிஎம் தீர்வின் நன்மை என்ன? நிறுவனத்தின் பிரதிநிதிகளின் கூற்றுப்படி, முதலில், தனிப்பயனாக்கம் மற்றும் தனியுரிமைப் பாதுகாப்பிற்கான அதிக வாய்ப்புகள்.
முதலில், வாட்சன் உதவியாளர் முத்திரை குத்தப்படவில்லை. நிறுவனங்கள் இந்த தளத்தில் தங்கள் சொந்த தீர்வுகளை உருவாக்கலாம் மற்றும் அவற்றை தங்கள் சொந்த பிராண்டுடன் லேபிளிடலாம்.
இரண்டாவதாக, மற்ற VUI (குரல் பயனர் இடைமுகம்) தொழில்நுட்பங்களைக் காட்டிலும், அந்த அமைப்பில் அம்சங்களையும் கட்டளைகளையும் சேர்ப்பதை எளிதாக்குகிறது என்று IBM கூறுகிறது.
மூன்றாவதாக, வாட்சன் உதவியாளர் IBM ஐ பயனர் செயல்பாடு பற்றிய தகவல்களை வழங்கவில்லை - மேடையில் தீர்வுகளை உருவாக்குபவர்கள் மதிப்புமிக்க தரவை மட்டுமே தங்களிடம் வைத்திருக்க முடியும். இதற்கிடையில், சாதனங்களை உருவாக்கும் எவரும், எடுத்துக்காட்டாக, அலெக்சாவுடன், அவர்களின் மதிப்புமிக்க தரவு அமேசானில் முடிவடையும் என்பதை அறிந்திருக்க வேண்டும்.
Watson Assistant ஏற்கனவே பல செயலாக்கங்களைக் கொண்டுள்ளது. எடுத்துக்காட்டாக, மசராட்டி கான்செப்ட் காருக்கு (6) குரல் உதவியாளரை உருவாக்கிய ஹர்மனால் இந்த அமைப்பு பயன்படுத்தப்பட்டது. முனிச் விமான நிலையத்தில், IBM உதவியாளர் ஒரு பெப்பர் ரோபோட் மூலம் பயணிகளுக்கு உதவுகிறார். மூன்றாவது உதாரணம் பச்சோந்தி டெக்னாலஜிஸ், இதில் ஸ்மார்ட் ஹோம் மீட்டரில் குரல் தொழில்நுட்பம் பயன்படுத்தப்படுகிறது.
6. மஸராட்டி கான்செப்ட் காரில் வாட்சன் உதவியாளர்
இங்குள்ள தொழில்நுட்பமும் புதியதல்ல என்பதைச் சேர்த்துக் கொள்வது மதிப்பு. Watson Assistant ஆனது ஏற்கனவே உள்ள IBM தயாரிப்புகள், Watson Conversation மற்றும் Watson Virtual Agent ஆகியவற்றிற்கான குறியாக்க திறன்களையும், மொழி பகுப்பாய்வு மற்றும் அரட்டைக்கான APIகளையும் உள்ளடக்கியது.
அமேசான் ஸ்மார்ட் குரல் தொழில்நுட்பத்தில் முன்னணியில் இருப்பது மட்டுமல்லாமல், அதை ஒரு நேரடி வணிகமாக மாற்றுகிறது. இருப்பினும், சில நிறுவனங்கள் எக்கோ ஒருங்கிணைப்பை மிகவும் முன்னதாகவே பரிசோதித்துள்ளன. BI மற்றும் அனலிட்டிக்ஸ் துறையில் உள்ள சிசென்ஸ், ஜூலை 2016 இல் எக்கோ ஒருங்கிணைப்பை அறிமுகப்படுத்தியது. இதையொட்டி, ஸ்டார்ட்அப் ராக்ஸி, விருந்தோம்பல் துறைக்காக தனது சொந்த குரல்-கட்டுப்பாட்டு மென்பொருள் மற்றும் வன்பொருளை உருவாக்க முடிவு செய்தது. இந்த ஆண்டின் தொடக்கத்தில், Synqq ஒரு குறிப்பு எடுக்கும் பயன்பாட்டை அறிமுகப்படுத்தியது, இது குரல் மற்றும் இயல்பான மொழி செயலாக்கத்தைப் பயன்படுத்தி குறிப்புகள் மற்றும் காலண்டர் உள்ளீடுகளை விசைப்பலகையில் தட்டச்சு செய்யாமல் சேர்க்கிறது.
இந்த சிறு வணிகங்கள் அனைத்தும் உயர்ந்த லட்சியங்களைக் கொண்டுள்ளன. எவ்வாறாயினும், எல்லாவற்றுக்கும் மேலாக, ஒவ்வொரு பயனரும் தங்கள் தரவை அமேசான், கூகுள், ஆப்பிள் அல்லது மைக்ரோசாப்ட் ஆகியவற்றிற்கு மாற்ற விரும்பவில்லை என்பதை அவர்கள் அறிந்து கொண்டனர், அவை குரல் தொடர்பு தளங்களை உருவாக்குவதில் மிக முக்கியமான வீரர்களாகும்.
அமெரிக்கர்கள் வாங்க விரும்புகிறார்கள்
2016 ஆம் ஆண்டில், கூகுள் மொபைல் தேடல்களில் 20% குரல் தேடல்தான். இந்த தொழில்நுட்பத்தை அன்றாடம் பயன்படுத்துபவர்கள் அதன் வசதி மற்றும் பல்பணியை அதன் மிகப்பெரிய நன்மைகளில் குறிப்பிடுகின்றனர். (உதாரணமாக, கார் ஓட்டும் போது தேடுபொறியைப் பயன்படுத்தும் திறன்).
Visiongain ஆய்வாளர்கள் ஸ்மார்ட் டிஜிட்டல் உதவியாளர்களின் தற்போதைய சந்தை மதிப்பு $1,138 பில்லியன் என மதிப்பிடுகின்றனர்.இதுபோன்ற வழிமுறைகள் மேலும் மேலும் உள்ளன. கார்ட்னரின் கூற்றுப்படி, 2018 ஆம் ஆண்டின் இறுதிக்குள் எங்கள் தொடர்புகளில் 30% குரல் அமைப்புகளுடன் உரையாடல்கள் மூலம் தொழில்நுட்பத்துடன் இருக்கும்.
பிரிட்டிஷ் ஆராய்ச்சி நிறுவனமான IHS Markit, AI-இயங்கும் டிஜிட்டல் உதவியாளர்களுக்கான சந்தை இந்த ஆண்டு இறுதிக்குள் 4 பில்லியன் சாதனங்களை எட்டும் என்றும், அந்த எண்ணிக்கை 2020க்குள் 7 பில்லியனாக உயரக்கூடும் என்றும் மதிப்பிட்டுள்ளது.
eMarketer மற்றும் VoiceLabs இன் அறிக்கைகளின்படி, 2017 இல் 35,6 மில்லியன் அமெரிக்கர்கள் குறைந்தபட்சம் மாதத்திற்கு ஒருமுறை குரல் கட்டுப்பாட்டைப் பயன்படுத்தினர். இது முந்தைய ஆண்டை விட கிட்டத்தட்ட 130% அதிகமாகும். டிஜிட்டல் உதவியாளர் சந்தை மட்டும் 2018ல் 23% வளர்ச்சியடையும் என எதிர்பார்க்கப்படுகிறது. நீங்கள் ஏற்கனவே அவற்றைப் பயன்படுத்துகிறீர்கள் என்று அர்த்தம். 60,5 மில்லியன் அமெரிக்கர்கள், இது அவர்களின் தயாரிப்பாளர்களுக்கு உறுதியான பணத்தை விளைவிக்கும். அலெக்சா இடைமுகம் 2020 ஆம் ஆண்டளவில் அமேசானுக்கு $10 பில்லியன் வரை வருவாயை ஈட்டும் என்று RBC Capital Markets மதிப்பிட்டுள்ளது.
கழுவவும், சுடவும், சுத்தம் செய்யவும்!
வீட்டு உபகரணங்கள் மற்றும் நுகர்வோர் மின்னணு சந்தைகளில் குரல் இடைமுகங்கள் பெருகிய முறையில் தைரியமாக நுழைகின்றன. கடந்த ஆண்டு IFA 2017 கண்காட்சியின் போது இதை ஏற்கனவே பார்க்க முடிந்தது. அமெரிக்க நிறுவனமான Neato Robotics, உதாரணமாக, Amazon Echo சிஸ்டம் உட்பட பல ஸ்மார்ட் ஹோம் பிளாட்பார்ம்களில் ஒன்றை இணைக்கும் ஒரு ரோபோ வாக்யூம் கிளீனரை அறிமுகப்படுத்தியது. எக்கோ ஸ்மார்ட் ஸ்பீக்கருடன் பேசுவதன் மூலம், பகல் அல்லது இரவின் குறிப்பிட்ட நேரத்தில் உங்கள் முழு வீட்டையும் சுத்தம் செய்யும்படி இயந்திரத்திற்கு அறிவுறுத்தலாம்.
துருக்கிய நிறுவனமான வெஸ்டலின் தோஷிபா பிராண்டின் கீழ் விற்கப்படும் ஸ்மார்ட் டிவிகள் முதல் ஜெர்மன் நிறுவனமான பியூரரின் சூடான போர்வைகள் வரை குரல்-செயல்படுத்தப்பட்ட பிற தயாரிப்புகள் நிகழ்ச்சியில் காட்சிப்படுத்தப்பட்டன. இந்த எலக்ட்ரானிக் சாதனங்களில் பலவற்றை ஸ்மார்ட்ஃபோன்களைப் பயன்படுத்தி ரிமோட் மூலமாகவும் செயல்படுத்த முடியும்.
இருப்பினும், போஷ் பிரதிநிதிகளின் கூற்றுப்படி, வீட்டு உதவியாளர் விருப்பங்களில் எது ஆதிக்கம் செலுத்தும் என்று சொல்வது மிக விரைவில். IFA 2017 இல், ஒரு ஜெர்மன் தொழில்நுட்பக் குழு எக்கோவுடன் இணைக்கும் வாஷிங் மெஷின்கள் (7), ஓவன்கள் மற்றும் காபி இயந்திரங்களைக் காட்சிப்படுத்தியது. எதிர்காலத்தில் அதன் சாதனங்கள் கூகுள் மற்றும் ஆப்பிள் குரல் தளங்களுடன் இணக்கமாக இருக்க வேண்டும் என்றும் Bosch விரும்புகிறது.
7. அமேசான் எக்கோவுடன் இணைக்கும் Bosch வாஷிங் மெஷின்
Fujitsu, Sony மற்றும் Panasonic போன்ற நிறுவனங்கள் தங்கள் சொந்த AI- அடிப்படையிலான குரல் உதவியாளர் தீர்வுகளை உருவாக்கி வருகின்றன. ஷார்ப் இந்த தொழில்நுட்பத்தை அடுப்புகளில் சேர்க்கிறது மற்றும் சந்தையில் நுழையும் சிறிய ரோபோக்கள். நிப்பான் டெலிகிராப் & டெலிஃபோன் குரல்-கட்டுப்படுத்தப்பட்ட செயற்கை நுண்ணறிவு அமைப்பை மாற்றியமைக்க ஹார்டுவேர் மற்றும் பொம்மை தயாரிப்பாளர்களை பணியமர்த்துகிறது.
பழைய கருத்து. இறுதியாக அவளுடைய நேரம் வந்ததா?
உண்மையில், குரல் பயனர் இடைமுகம் (VUI) என்ற கருத்து பல தசாப்தங்களாக உள்ளது. Star Trek அல்லது 2001: A Space Odyssey ஐப் பார்த்த எவரும், 2000 ஆம் ஆண்டு வாக்கில் நாம் அனைவரும் நம் குரல்களால் கணினிகளைக் கட்டுப்படுத்துவோம் என்று எதிர்பார்த்திருக்கலாம். மேலும், இந்த வகையான இடைமுகத்தின் திறனைக் கண்ட அறிவியல் புனைகதை எழுத்தாளர்கள் மட்டும் அல்ல. 1986 ஆம் ஆண்டில், நீல்சன் ஆராய்ச்சியாளர்கள் IT நிபுணர்களிடம் 2000 ஆம் ஆண்டுக்குள் பயனர் இடைமுகங்களில் மிகப்பெரிய மாற்றமாக இருக்கும் என்று அவர்கள் நினைத்தார்கள். அவை பெரும்பாலும் குரல் இடைமுகங்களின் வளர்ச்சியை சுட்டிக்காட்டுகின்றன.
அத்தகைய தீர்வை நம்புவதற்கு காரணங்கள் உள்ளன. எல்லாவற்றிற்கும் மேலாக, வாய்மொழி தகவல்தொடர்பு என்பது மக்கள் உணர்வுபூர்வமாக எண்ணங்களைப் பரிமாறிக் கொள்வதற்கான மிகவும் இயல்பான வழியாகும், எனவே மனித-இயந்திர தொடர்புக்கு அதைப் பயன்படுத்துவது இதுவரை சிறந்த தீர்வாகத் தெரிகிறது.
அழைக்கப்படும் முதல் VUIகளில் ஒன்று காலணி பெட்டி60 களின் முற்பகுதியில் IBM ஆல் உருவாக்கப்பட்டது. இது இன்றைய குரல் அங்கீகார அமைப்புகளின் முன்னோடியாக இருந்தது. இருப்பினும், VUI சாதனங்களின் வளர்ச்சி கணினி சக்தியின் வரம்புகளால் வரையறுக்கப்பட்டது. மனித பேச்சை நிகழ்நேரத்தில் அலசுவதற்கும் விளக்குவதற்கும் நிறைய முயற்சிகள் தேவை, அது உண்மையில் சாத்தியம் என்ற நிலைக்கு வர ஐம்பது ஆண்டுகளுக்கும் மேலாக ஆனது.
குரல் இடைமுகம் கொண்ட சாதனங்கள் 90 களின் நடுப்பகுதியில் வெகுஜன உற்பத்தியில் தோன்றத் தொடங்கின, ஆனால் அவை பிரபலமடையவில்லை. குரல் கட்டுப்பாடு (டயல்) கொண்ட முதல் தொலைபேசி பிலிப்ஸ் ஸ்பார்க்1996 இல் வெளியிடப்பட்டது. இருப்பினும், இந்த புதுமையான மற்றும் பயன்படுத்த எளிதான சாதனம் தொழில்நுட்ப வரம்புகளிலிருந்து விடுபடவில்லை.
குரல் இடைமுக வடிவங்களைக் கொண்ட பிற ஃபோன்கள் (ஆர்ஐஎம், சாம்சங் அல்லது மோட்டோரோலா போன்ற நிறுவனங்களால் உருவாக்கப்பட்டது) தொடர்ந்து சந்தையில் வந்து, பயனர்கள் குரல் மூலம் டயல் செய்ய அல்லது குறுஞ்செய்திகளை அனுப்ப அனுமதிக்கிறது. எவ்வாறாயினும், அவை அனைத்தும் குறிப்பிட்ட கட்டளைகளை மனப்பாடம் செய்ய வேண்டும் மற்றும் அக்கால சாதனங்களின் திறன்களுக்கு ஏற்றவாறு கட்டாய, செயற்கை வடிவத்தில் அவற்றை உச்சரிக்க வேண்டும். இது அதிக எண்ணிக்கையிலான பிழைகளை உருவாக்கியது, இது பயனர் அதிருப்திக்கு வழிவகுத்தது.
எவ்வாறாயினும், நாம் இப்போது கணினியின் புதிய சகாப்தத்தில் நுழைகிறோம், இதில் இயந்திர கற்றல் மற்றும் செயற்கை நுண்ணறிவு ஆகியவற்றின் முன்னேற்றங்கள் தொழில்நுட்பத்துடன் தொடர்புகொள்வதற்கான ஒரு புதிய வழியாக உரையாடலின் திறனைத் திறக்கின்றன (8). குரல் தொடர்புகளை ஆதரிக்கும் சாதனங்களின் எண்ணிக்கை VUI இன் வளர்ச்சியில் பெரிய தாக்கத்தை ஏற்படுத்திய முக்கிய காரணியாக மாறியுள்ளது. இன்று, உலக மக்கள்தொகையில் கிட்டத்தட்ட 1/3 பேர் ஏற்கனவே இந்த வகையான நடத்தைக்கு பயன்படுத்தக்கூடிய ஸ்மார்ட்போன்களை வைத்திருக்கிறார்கள். பெரும்பாலான பயனர்கள் இறுதியாக தங்கள் குரல் இடைமுகங்களை மாற்றியமைக்க தயாராக இருப்பது போல் தெரிகிறது.
8. குரல் இடைமுகத்தின் வளர்ச்சியின் நவீன வரலாறு
எவ்வாறாயினும், ஒரு ஸ்பேஸ் ஒடிஸியின் ஹீரோக்கள் செய்ததைப் போல, கணினியுடன் சுதந்திரமாக பேசுவதற்கு முன், நாம் பல சிக்கல்களை சமாளிக்க வேண்டும். மொழியியல் நுணுக்கங்களைக் கையாளுவதில் இயந்திரங்கள் இன்னும் சிறப்பாக இல்லை. தவிர தேடுபொறிக்கு குரல் கட்டளைகளை வழங்குவதில் பலர் இன்னும் சங்கடமாக உணர்கிறார்கள்.
குரல் உதவியாளர்கள் முதன்மையாக வீட்டில் அல்லது நெருங்கிய நண்பர்களிடையே பயன்படுத்தப்படுவதாக புள்ளிவிவரங்கள் காட்டுகின்றன. பொது இடங்களில் குரல் தேடலைப் பயன்படுத்தியதை நேர்காணல் செய்தவர்கள் யாரும் ஒப்புக்கொள்ளவில்லை. இருப்பினும், இந்த தொழில்நுட்பம் பரவினால் இந்த தடை மறைந்துவிடும்.
தொழில்நுட்ப ரீதியாக கடினமான கேள்வி
சிஸ்டம்ஸ் (ஏஎஸ்ஆர்) எதிர்கொள்ளும் பிரச்சனை, பேச்சு சமிக்ஞையிலிருந்து பயனுள்ள தரவைப் பிரித்தெடுத்து, ஒரு நபருக்கு ஒரு குறிப்பிட்ட பொருளைக் கொண்ட ஒரு குறிப்பிட்ட வார்த்தையுடன் அதை இணைப்பதாகும். ஒவ்வொரு முறையும் உருவாக்கப்படும் ஒலிகள் வேறுபட்டவை.
பேச்சு சமிக்ஞை மாறுபாடு அதன் இயற்கையான சொத்து, இதற்கு நன்றி, எடுத்துக்காட்டாக, ஒரு உச்சரிப்பு அல்லது ஒலியை நாம் அங்கீகரிக்கிறோம். பேச்சு அங்கீகார அமைப்பின் ஒவ்வொரு உறுப்புக்கும் ஒரு குறிப்பிட்ட பணி உள்ளது. செயலாக்கப்பட்ட சமிக்ஞை மற்றும் அதன் அளவுருக்களின் அடிப்படையில், ஒரு ஒலி மாதிரி உருவாக்கப்பட்டது, இது மொழி மாதிரியுடன் தொடர்புடையது. அங்கீகார அமைப்பு சிறிய அல்லது பெரிய எண்ணிக்கையிலான வடிவங்களின் அடிப்படையில் செயல்பட முடியும், இது செயல்படும் சொற்களஞ்சியத்தின் அளவை தீர்மானிக்கிறது. அவர்கள் இருக்கலாம் சிறிய அகராதிகள் தனிப்பட்ட வார்த்தைகள் அல்லது கட்டளைகளை அங்கீகரிக்கும் அமைப்புகளின் விஷயத்தில், மற்றும் பெரிய தரவுத்தளங்கள் மொழித் தொகுப்பிற்குச் சமமானதைக் கொண்டுள்ளது மற்றும் மொழி மாதிரியை (இலக்கணம்) கணக்கில் எடுத்துக்கொள்கிறது.
முதலில் குரல் இடைமுகங்கள் எதிர்கொள்ளும் சிக்கல்கள் பேச்சை சரியாக புரிந்து கொள்ளுங்கள், எடுத்துக்காட்டாக, முழு இலக்கண வரிசைகளும் பெரும்பாலும் தவிர்க்கப்படுகின்றன, மொழியியல் மற்றும் ஒலிப்பு பிழைகள், பிழைகள், குறைபாடுகள், பேச்சு குறைபாடுகள், ஹோமோனிம்கள், நியாயப்படுத்தப்படாத மறுபரிசீலனைகள் போன்றவை ஏற்படுகின்றன. இந்த ACP அமைப்புகள் அனைத்தும் விரைவாகவும் நம்பகத்தன்மையுடனும் செயல்பட வேண்டும். குறைந்தபட்சம் அந்த எதிர்பார்ப்புகள்.
சிரமங்களின் மூலமானது, அங்கீகார அமைப்பின் உள்ளீட்டில் நுழையும் அங்கீகரிக்கப்பட்ட பேச்சைத் தவிர வேறு ஒலி சமிக்ஞைகள் ஆகும், அதாவது. அனைத்து வகையான குறுக்கீடு மற்றும் சத்தம். எளிமையான வழக்கில், உங்களுக்கு அவை தேவை வடிகட்டி. இந்த பணி வழக்கமானதாகவும் எளிதாகவும் தெரிகிறது - எல்லாவற்றிற்கும் மேலாக, பல்வேறு சமிக்ஞைகள் வடிகட்டப்படுகின்றன மற்றும் ஒவ்வொரு மின்னணு பொறியாளருக்கும் அத்தகைய சூழ்நிலையில் என்ன செய்வது என்று தெரியும். இருப்பினும், பேச்சு அங்கீகாரத்தின் விளைவாக நமது எதிர்பார்ப்புகளை பூர்த்தி செய்ய வேண்டுமானால், இது மிகவும் கவனமாகவும் கவனமாகவும் செய்யப்பட வேண்டும்.
தற்போது பயன்படுத்தப்படும் வடிகட்டுதல், பேச்சு சமிக்ஞையுடன், மைக்ரோஃபோனால் எடுக்கப்பட்ட வெளிப்புற சத்தம் மற்றும் பேச்சு சமிக்ஞையின் உள் பண்புகளை அகற்றுவதை சாத்தியமாக்குகிறது, இது அதை அடையாளம் காண்பதை கடினமாக்குகிறது. இருப்பினும், பகுப்பாய்வு செய்யப்பட்ட பேச்சு சமிக்ஞைக்கு குறுக்கீடு செய்யும்போது மிகவும் சிக்கலான தொழில்நுட்ப சிக்கல் எழுகிறது ... மற்றொரு பேச்சு சமிக்ஞை, அதாவது, எடுத்துக்காட்டாக, உரத்த விவாதங்கள். இந்த கேள்வி இலக்கியத்தில் அழைக்கப்படுகிறது என்று அழைக்கப்படுகிறது. இதற்கு ஏற்கனவே சிக்கலான முறைகளைப் பயன்படுத்த வேண்டும், என்று அழைக்கப்படுபவை. deconvolution (அவிழ்த்து) சமிக்ஞை.
பேச்சு அங்கீகாரத்தில் உள்ள சிக்கல்கள் அங்கு முடிவதில்லை. பேச்சு பல வகையான தகவல்களைக் கொண்டுள்ளது என்பதை உணர வேண்டியது அவசியம். மனித குரல் உரிமையாளரின் பாலினம், வயது, வெவ்வேறு குணாதிசயங்கள் அல்லது அவரது உடல்நிலை ஆகியவற்றைக் குறிக்கிறது. பேச்சு சமிக்ஞையில் காணப்படும் சிறப்பியல்பு ஒலி நிகழ்வுகளின் அடிப்படையில் பல்வேறு நோய்களைக் கண்டறிவதில் பயோமெடிக்கல் இன்ஜினியரிங் ஒரு விரிவான துறை உள்ளது.
பேச்சு சமிக்ஞையின் ஒலியியல் பகுப்பாய்வின் முக்கிய நோக்கம் பேச்சாளரை அடையாளம் காண்பது அல்லது அவர் யார் என்று கூறுவது (விசை, கடவுச்சொல் அல்லது PUK குறியீட்டிற்குப் பதிலாக குரல்) என்பதைச் சரிபார்க்கும் பயன்பாடுகளும் உள்ளன. இது முக்கியமானதாக இருக்கலாம், குறிப்பாக ஸ்மார்ட் கட்டிடத் தொழில்நுட்பங்களுக்கு.
பேச்சு அங்கீகார அமைப்பின் முதல் கூறு ஒரு மைக்ரோஃபோன். இருப்பினும், மைக்ரோஃபோன் மூலம் எடுக்கப்படும் சிக்னல் பொதுவாக சிறிய பயன்பாட்டில் இருக்கும். ஒலி அலையின் வடிவம் மற்றும் போக்கானது நபர், பேச்சின் வேகம் மற்றும் ஓரளவு உரையாசிரியரின் மனநிலையைப் பொறுத்து பெரிதும் மாறுபடும் என்று ஆய்வுகள் காட்டுகின்றன - சிறிய அளவில் அவை பேசும் கட்டளைகளின் உள்ளடக்கத்தை பிரதிபலிக்கின்றன.
எனவே, சமிக்ஞை சரியாக செயலாக்கப்பட வேண்டும். நவீன ஒலியியல், ஒலியியல் மற்றும் கணினி அறிவியல் ஆகியவை ஒரு பேச்சு சமிக்ஞையை செயலாக்க, பகுப்பாய்வு செய்ய, அடையாளம் காண மற்றும் புரிந்து கொள்ள பயன்படுத்தக்கூடிய ஏராளமான கருவிகளை வழங்குகின்றன. சமிக்ஞையின் டைனமிக் ஸ்பெக்ட்ரம், என்று அழைக்கப்படும் டைனமிக் ஸ்பெக்ட்ரோகிராம்கள். அவற்றைப் பெறுவது மிகவும் எளிதானது, மேலும் டைனமிக் ஸ்பெக்ட்ரோகிராம் வடிவத்தில் வழங்கப்படும் பேச்சு, பட அங்கீகாரத்தில் பயன்படுத்தப்படும் நுட்பங்களைப் பயன்படுத்தி அடையாளம் காண்பது ஒப்பீட்டளவில் எளிதானது.
பேச்சின் எளிய கூறுகள் (உதாரணமாக, கட்டளைகள்) முழு ஸ்பெக்ட்ரோகிராம்களின் எளிய ஒற்றுமையால் அங்கீகரிக்கப்படலாம். எடுத்துக்காட்டாக, குரல்-செயல்படுத்தப்பட்ட மொபைல் ஃபோன் அகராதியில் சில பத்துகள் முதல் சில நூறு சொற்கள் மற்றும் சொற்றொடர்கள் மட்டுமே உள்ளன, பொதுவாக அவை எளிதாகவும் திறமையாகவும் அடையாளம் காணக்கூடிய வகையில் முன்கூட்டியே அடுக்கி வைக்கப்படும். எளிமையான கட்டுப்பாட்டு பணிகளுக்கு இது போதுமானது, ஆனால் இது ஒட்டுமொத்த பயன்பாட்டை கடுமையாக கட்டுப்படுத்துகிறது. திட்டத்தின் படி கட்டமைக்கப்பட்ட அமைப்புகள், ஒரு விதியாக, குரல்கள் சிறப்பாகப் பயிற்சியளிக்கப்பட்ட குறிப்பிட்ட பேச்சாளர்களை மட்டுமே ஆதரிக்கின்றன. எனவே கணினியைக் கட்டுப்படுத்த தங்கள் குரலைப் பயன்படுத்த விரும்பும் புதிதாக யாராவது இருந்தால், அவர்கள் பெரும்பாலும் ஏற்றுக்கொள்ளப்பட மாட்டார்கள்.
இந்த செயல்பாட்டின் முடிவு அழைக்கப்படுகிறது 2-W ஸ்பெக்ட்ரோகிராம், அதாவது, இரு பரிமாண நிறமாலை. இந்தத் தொகுதியில் கவனம் செலுத்த வேண்டிய மற்றொரு செயல்பாடு உள்ளது - பிரிவு. பொதுவாக, தொடர்ச்சியான பேச்சு சமிக்ஞையை தனித்தனியாக அடையாளம் காணக்கூடிய பகுதிகளாக உடைப்பது பற்றி பேசுகிறோம். இந்த தனிப்பட்ட நோயறிதல்களில் இருந்துதான் முழுமைக்கான அங்கீகாரம் உருவாகிறது. இந்த செயல்முறை அவசியம், ஏனென்றால் ஒரு நீண்ட மற்றும் சிக்கலான பேச்சை ஒரே நேரத்தில் அடையாளம் காண முடியாது. பேச்சு சிக்னலில் எந்தப் பிரிவுகளை வேறுபடுத்துவது என்பது பற்றி முழு தொகுதிகளும் ஏற்கனவே எழுதப்பட்டுள்ளன, எனவே தனித்தனி பிரிவுகள் ஃபோன்மேஸ்கள் (ஒலிக்கு சமமானவை), எழுத்துக்கள் அல்லது அலோஃபோன்களாக இருக்க வேண்டுமா என்பதை நாங்கள் இப்போது தீர்மானிக்க மாட்டோம்.
தானியங்கி அங்கீகாரத்தின் செயல்முறை எப்போதும் பொருட்களின் சில அம்சங்களைக் குறிக்கிறது. பேச்சு சமிக்ஞைக்காக நூற்றுக்கணக்கான வெவ்வேறு அளவுருக்கள் சோதனை செய்யப்பட்டுள்ளன. பேச்சு சமிக்ஞை உள்ளது அங்கீகரிக்கப்பட்ட சட்டங்களாக பிரிக்கப்பட்டுள்ளது மற்றும் கொண்ட தேர்ந்தெடுக்கப்பட்ட அம்சங்கள்இந்த பிரேம்கள் அங்கீகார செயல்பாட்டில் வழங்கப்படுவதால், நாம் செய்ய முடியும் (ஒவ்வொரு சட்டத்திற்கும் தனித்தனியாக) வகைப்பாடு, அதாவது சட்டத்திற்கு ஒரு அடையாளங்காட்டியை ஒதுக்குகிறது, இது எதிர்காலத்தில் அதைக் குறிக்கும்.
அடுத்த கட்டம் பிரேம்களை தனித்தனி சொற்களாகச் சேர்த்தல் - பெரும்பாலும் அழைக்கப்படுவதை அடிப்படையாகக் கொண்டது மறைமுகமான மார்கோவ் மாதிரிகளின் மாதிரி (IMM-). பின்னர் வார்த்தைகளின் தொகுப்பு வருகிறது முழுமையான வாக்கியங்கள்.
நாம் இப்போது அலெக்சா அமைப்புக்கு ஒரு கணம் திரும்பலாம். அவரது உதாரணம் ஒரு நபரின் இயந்திர "புரிந்துகொள்ளும்" பல-நிலை செயல்முறையைக் காட்டுகிறது - இன்னும் துல்லியமாக: அவர் வழங்கிய கட்டளை அல்லது கேட்கப்பட்ட கேள்வி.
சொற்களைப் புரிந்துகொள்வது, பொருளைப் புரிந்துகொள்வது மற்றும் பயனர் நோக்கத்தைப் புரிந்துகொள்வது முற்றிலும் வேறுபட்ட விஷயங்கள்.
எனவே, அடுத்த கட்டம் என்எல்பி தொகுதியின் வேலை (), இதன் பணி பயனர் நோக்கம் அங்கீகாரம், அதாவது கட்டளை/கேள்வி சொல்லப்பட்ட சூழலில் அதன் பொருள். நோக்கம் அடையாளம் காணப்பட்டால், பின்னர் திறன்கள் மற்றும் திறன்கள் என்று அழைக்கப்படுபவை, அதாவது ஸ்மார்ட் உதவியாளரால் ஆதரிக்கப்படும் குறிப்பிட்ட அம்சம். வானிலை பற்றிய கேள்வியின் விஷயத்தில், வானிலை தரவு ஆதாரங்கள் அழைக்கப்படுகின்றன, அவை பேச்சில் செயலாக்கப்பட வேண்டும் (TTS - பொறிமுறை). இதன் விளைவாக, பயனர் கேட்கப்பட்ட கேள்விக்கான பதிலைக் கேட்கிறார்.
குரலா? கிராஃபிக் கலையா? அல்லது இரண்டும் இருக்கலாம்?
மிகவும் அறியப்பட்ட நவீன தொடர்பு அமைப்புகள் என்று அழைக்கப்படும் ஒரு இடைத்தரகர் அடிப்படையிலானது வரைகலை பயனாளர் இடைமுகம் (வரைகலை இடைமுகம்). துரதிருஷ்டவசமாக, ஒரு டிஜிட்டல் தயாரிப்புடன் தொடர்புகொள்வதற்கான மிகத் தெளிவான வழி GUI அல்ல. பயனர்கள் இடைமுகத்தை எவ்வாறு பயன்படுத்துவது என்பதை முதலில் கற்றுக் கொள்ள வேண்டும் மற்றும் ஒவ்வொரு அடுத்தடுத்த தொடர்புகளிலும் இந்தத் தகவலை நினைவில் வைத்துக் கொள்ள வேண்டும். பல சூழ்நிலைகளில், குரல் மிகவும் வசதியானது, ஏனெனில் நீங்கள் சாதனத்துடன் பேசுவதன் மூலம் VUI உடன் தொடர்பு கொள்ளலாம். சில கட்டளைகள் அல்லது தொடர்பு முறைகளை மனப்பாடம் செய்ய மற்றும் மனப்பாடம் செய்ய பயனர்களை கட்டாயப்படுத்தாத இடைமுகம் குறைவான சிக்கல்களை ஏற்படுத்துகிறது.
நிச்சயமாக, VUI இன் விரிவாக்கம் என்பது பாரம்பரிய இடைமுகங்களைக் கைவிடுவதைக் குறிக்காது - மாறாக, கலப்பின இடைமுகங்கள் கிடைக்கின்றன, அவை தொடர்புகொள்வதற்கான பல வழிகளை இணைக்கும்.
மொபைல் சூழலில் அனைத்து பணிகளுக்கும் குரல் இடைமுகம் பொருந்தாது. இதன் மூலம், கார் ஓட்டும் போது நண்பரை அழைப்போம், அவருக்கு எஸ்எம்எஸ் கூட அனுப்புவோம், ஆனால் சமீபத்திய இடமாற்றங்களைச் சரிபார்ப்பது மிகவும் கடினமாக இருக்கலாம் - கணினிக்கு அனுப்பப்படும் தகவல்களின் அளவு () மற்றும் கணினி (அமைப்பு) மூலம் உருவாக்கப்படுகிறது. . Rachel Hinman தனது மொபைல் ஃபிரான்டியர் புத்தகத்தில் குறிப்பிடுவது போல், உள்ளீடு மற்றும் வெளியீட்டுத் தகவலின் அளவு சிறியதாக இருக்கும் பணிகளைச் செய்யும்போது VUI ஐப் பயன்படுத்துவது மிகவும் பயனுள்ளதாக இருக்கும்.
இணையத்துடன் இணைக்கப்பட்ட ஸ்மார்ட்போன் வசதியானது ஆனால் சிரமமானது (9). ஒவ்வொரு முறையும் ஒரு பயனர் ஏதாவது வாங்க அல்லது புதிய சேவையைப் பயன்படுத்த விரும்பினால், அவர்கள் மற்றொரு பயன்பாட்டைப் பதிவிறக்கி புதிய கணக்கை உருவாக்க வேண்டும். குரல் இடைமுகங்களின் பயன்பாடு மற்றும் மேம்பாட்டிற்கான ஒரு புலம் இங்கே உருவாக்கப்பட்டுள்ளது. பலவிதமான பயன்பாடுகளை நிறுவ அல்லது ஒவ்வொரு சேவைக்கும் தனித்தனி கணக்குகளை உருவாக்க பயனர்களை கட்டாயப்படுத்துவதற்கு பதிலாக, வல்லுநர்கள் VUI இந்த சிக்கலான பணிகளின் சுமையை AI-இயங்கும் குரல் உதவியாளருக்கு மாற்றும் என்று கூறுகின்றனர். கடினமான செயல்களைச் செய்ய அவருக்கு வசதியாக இருக்கும். அவருக்கு உத்தரவு மட்டுமே கொடுப்போம்.
9. ஸ்மார்ட் போன் வழியாக குரல் இடைமுகம்
இன்றைக்கு ஒரு போன், கம்ப்யூட்டரை விட இன்டர்நெட் இணைக்கப்பட்டுள்ளது. ஸ்மார்ட் தெர்மோஸ்டாட்கள், விளக்குகள், கெட்டில்கள் மற்றும் பல IoT-ஒருங்கிணைந்த சாதனங்களும் நெட்வொர்க்குடன் இணைக்கப்பட்டுள்ளன (10). இவ்வாறு, நம் வாழ்க்கையை நிரப்பும் வயர்லெஸ் சாதனங்கள் நம்மைச் சுற்றி உள்ளன, ஆனால் அவை அனைத்தும் இயற்கையாகவே வரைகலை பயனர் இடைமுகத்தில் பொருந்தாது. VUIஐப் பயன்படுத்துவது, அவற்றை நமது சூழலில் எளிதாக ஒருங்கிணைக்க உதவும்.
10. இன்டர்நெட் ஆஃப் திங்ஸுடன் குரல் இடைமுகம்
குரல் பயனர் இடைமுகத்தை உருவாக்குவது விரைவில் ஒரு முக்கிய வடிவமைப்பாளர் திறமையாக மாறும். இது ஒரு உண்மையான பிரச்சனை - குரல் அமைப்புகளை செயல்படுத்த வேண்டிய அவசியம், செயலூக்கமான வடிவமைப்பில் அதிக கவனம் செலுத்த உங்களை ஊக்குவிக்கும், அதாவது, உரையாடலின் ஒவ்வொரு கட்டத்திலும் பயனரின் ஆரம்ப நோக்கங்களைப் புரிந்து கொள்ள முயற்சிக்கிறது, அவர்களின் தேவைகளையும் எதிர்பார்ப்புகளையும் எதிர்பார்க்கிறது.
குரல் என்பது தரவை உள்ளிடுவதற்கான ஒரு திறமையான வழியாகும் - இது பயனர்கள் தங்கள் சொந்த விதிமுறைகளில் கணினிக்கு விரைவாக கட்டளைகளை வழங்க அனுமதிக்கிறது. மறுபுறம், திரையானது தகவலைக் காண்பிக்க ஒரு திறமையான வழியை வழங்குகிறது: இது கணினிகளை ஒரே நேரத்தில் அதிக அளவிலான தகவலைக் காட்ட அனுமதிக்கிறது, பயனர்களின் நினைவகத்தின் சுமையை குறைக்கிறது. அவற்றை ஒரு அமைப்பில் இணைப்பது ஊக்கமளிக்கிறது என்பது தர்க்கரீதியானது.
Amazon Echo மற்றும் Google Home போன்ற ஸ்மார்ட் ஸ்பீக்கர்கள் காட்சி காட்சியை வழங்குவதில்லை. மிதமான தூரத்தில் குரல் அங்கீகாரத்தின் துல்லியத்தை கணிசமாக மேம்படுத்துகிறது, அவை ஹேண்ட்ஸ்-ஃப்ரீ செயல்பாட்டை அனுமதிக்கின்றன, இது அவர்களின் நெகிழ்வுத்தன்மையையும் செயல்திறனையும் அதிகரிக்கிறது - ஏற்கனவே குரல் கட்டுப்பாட்டுடன் கூடிய ஸ்மார்ட்போன்களை வைத்திருக்கும் பயனர்களுக்கு கூட அவை விரும்பத்தக்கவை. இருப்பினும், திரை இல்லாதது ஒரு பெரிய வரம்பு.
சாத்தியமான கட்டளைகளைப் பயனர்களுக்குத் தெரிவிக்க பீப்களை மட்டுமே பயன்படுத்த முடியும், மேலும் மிக அடிப்படையான பணிகளைத் தவிர்த்து வெளியீட்டை உரக்கப் படிப்பது கடினமானதாகிவிடும். சமைக்கும் போது குரல் கட்டளையுடன் டைமரை அமைப்பது சிறப்பானது, ஆனால் இன்னும் எவ்வளவு நேரம் இருக்கிறது என்று கேட்க வேண்டிய அவசியம் இல்லை. வழக்கமான வானிலை முன்னறிவிப்பைப் பெறுவது பயனருக்கு நினைவகத்தின் சோதனையாக மாறும், அவர் ஒரு பார்வையில் திரையில் இருந்து எடுக்காமல், வாரம் முழுவதும் தொடர்ச்சியான உண்மைகளைக் கேட்டு உள்வாங்க வேண்டும்.
வடிவமைப்பாளர்கள் ஏற்கனவே உள்ளனர் கலப்பின தீர்வு, எக்கோ ஷோ (11), இது அடிப்படை எக்கோ ஸ்மார்ட் ஸ்பீக்கரில் காட்சித் திரையைச் சேர்த்தது. இது உபகரணங்களின் செயல்பாட்டை பெரிதும் விரிவுபடுத்துகிறது. இருப்பினும், எக்கோ ஷோ ஸ்மார்ட்போன்கள் மற்றும் டேப்லெட்களில் நீண்ட காலமாக இருக்கும் அடிப்படை செயல்பாடுகளைச் செய்யும் திறன் குறைவாகவே உள்ளது. இது (இன்னும்) இணையத்தில் உலாவவோ, மதிப்புரைகளைக் காட்டவோ அல்லது அமேசான் ஷாப்பிங் கார்ட்டின் உள்ளடக்கங்களைக் காட்டவோ முடியாது.
ஒரு காட்சிக் காட்சி என்பது ஒலியை விட அதிகமான தகவல்களை மக்களுக்கு வழங்குவதற்கான ஒரு சிறந்த வழியாகும். குரல் முன்னுரிமையுடன் வடிவமைப்பது குரல் தொடர்புகளை பெரிதும் மேம்படுத்தலாம், ஆனால் நீண்ட காலத்திற்கு, தன்னிச்சையாக தொடர்புக்காக காட்சி மெனுவைப் பயன்படுத்தாமல் இருப்பது உங்கள் முதுகில் ஒரு கையைக் கட்டிக்கொண்டு சண்டையிடுவது போலாகும். நுண்ணறிவு குரல் மற்றும் காட்சி இடைமுகங்களின் சிக்கலான தன்மை காரணமாக, டெவலப்பர்கள் இடைமுகங்களுக்கான கலப்பின அணுகுமுறையை தீவிரமாக பரிசீலிக்க வேண்டும்.
பேச்சு உருவாக்கம் மற்றும் அங்கீகார அமைப்புகளின் செயல்திறன் மற்றும் வேகத்தை அதிகரிப்பது, எடுத்துக்காட்டாக, பயன்பாடுகள் மற்றும் பகுதிகளில் அவற்றைப் பயன்படுத்துவதை சாத்தியமாக்கியது:
• இராணுவம் (விமானங்கள் அல்லது ஹெலிகாப்டர்களில் குரல் கட்டளைகள், எடுத்துக்காட்டாக, F16 VISTA),
• தானியங்கி உரை படியெடுத்தல் (உரையிலிருந்து உரை வரை),
• ஊடாடும் தகவல் அமைப்புகள் (பிரதம பேச்சு, குரல் இணையதளங்கள்),
• மொபைல் சாதனங்கள் (தொலைபேசிகள், ஸ்மார்ட்போன்கள், டேப்லெட்டுகள்),
• ரோபாட்டிக்ஸ் (கிளவர்போட் - செயற்கை நுண்ணறிவுடன் இணைந்த ASR அமைப்புகள்),
• வாகனம் (புளூ & மீ போன்ற கார் பாகங்களின் ஹேண்ட்ஸ்-ஃப்ரீ கட்டுப்பாடு),
• வீட்டு பயன்பாடுகள் (ஸ்மார்ட் ஹோம் சிஸ்டம்ஸ்).
பாதுகாப்பிற்காக கவனியுங்கள்!
வாகனம், வீட்டு உபயோகப் பொருட்கள், வெப்பமூட்டும்/குளிரூட்டல் மற்றும் வீட்டுப் பாதுகாப்பு அமைப்புகள் மற்றும் பல வீட்டு உபயோகப் பொருட்கள் குரல் இடைமுகங்களைப் பயன்படுத்தத் தொடங்கியுள்ளன, பெரும்பாலும் AI- அடிப்படையிலானவை. இந்த கட்டத்தில், இயந்திரங்களுடன் மில்லியன் கணக்கான உரையாடல்களிலிருந்து பெறப்பட்ட தரவு அனுப்பப்படுகிறது கம்ப்யூட்டிங் மேகங்கள். விற்பனையாளர்கள் அவற்றில் ஆர்வமாக உள்ளனர் என்பது தெளிவாகிறது. அவர்கள் மட்டுமல்ல.
சைமென்டெக் பாதுகாப்பு நிபுணர்களின் சமீபத்திய அறிக்கை, குரல் கட்டளை பயனர்கள் கதவு பூட்டுகள் போன்ற பாதுகாப்பு அம்சங்களைக் கட்டுப்படுத்த வேண்டாம், வீட்டுப் பாதுகாப்பு அமைப்புகளைக் கட்டுப்படுத்த வேண்டாம் என்று பரிந்துரைக்கிறது. கடவுச்சொற்கள் அல்லது ரகசிய தகவல்களை சேமிப்பதற்கும் இதுவே செல்கிறது. செயற்கை நுண்ணறிவு மற்றும் ஸ்மார்ட் தயாரிப்புகளின் பாதுகாப்பு இன்னும் போதுமான அளவு ஆய்வு செய்யப்படவில்லை.
வீடு முழுவதும் உள்ள சாதனங்கள் ஒவ்வொரு வார்த்தையையும் கேட்கும் போது, சிஸ்டம் ஹேக்கிங் மற்றும் தவறாகப் பயன்படுத்தப்படும் அபாயம் பெரும் கவலையாகிறது. தாக்குபவர் உள்ளூர் நெட்வொர்க் அல்லது அதனுடன் தொடர்புடைய மின்னஞ்சல் முகவரிகளுக்கான அணுகலைப் பெற்றால், ஸ்மார்ட் சாதன அமைப்புகளை மாற்றலாம் அல்லது தொழிற்சாலை அமைப்புகளுக்கு மீட்டமைக்கலாம், இது மதிப்புமிக்க தகவல் மற்றும் பயனர் வரலாற்றை நீக்குவதற்கு வழிவகுக்கும்.
வேறு வார்த்தைகளில் கூறுவதானால், குரல் மூலம் இயக்கப்படும் AI மற்றும் VUI ஆகியவை சாத்தியமான அச்சுறுத்தல்களிலிருந்து நம்மைப் பாதுகாக்கும் அளவுக்கு இன்னும் புத்திசாலித்தனமாக இல்லை என்று பாதுகாப்பு வல்லுநர்கள் அஞ்சுகிறார்கள் மற்றும் அந்நியன் ஏதாவது கேட்டால் வாயை மூடிக்கொள்கிறார்கள்.