বাড়ি সফটওয়্যার ভয়েস স্বীকৃতি প্রযুক্তি: সহায়ক বা বেদনাদায়ক?

ভয়েস স্বীকৃতি প্রযুক্তি: সহায়ক বা বেদনাদায়ক?

সুচিপত্র:

Anonim

আপনি কি কোনও সংস্থাকে কিছু সাহায্য পাওয়ার জন্য বা আপনার বিল পরিশোধ করার জন্য ডেকেছেন, কেবল আপনার সাথে কথোপকথন করতে চায় এমন একটি মনোরম রেকর্ডকৃত ভয়েস দ্বারা অভ্যর্থনা জানাতে - তবে আপনি যা বলছেন তার অর্ধেক বুঝতে পারছেন না? অথবা হতে পারে আপনি একটি আইফোনের মালিক, এবং সিরি যখন প্রথম ভাল মিত্র হিসাবে মনে হয়েছিল, আপনি বুঝতে পেরেছেন যে কখনও কখনও (ঠিক আছে, আসুন সত্য কথা বলা যাক) প্রায়ই সে পায় না? ভয়েস রিকগনিশন প্রযুক্তি (ভিআরটি), যা স্পিচ-টু-টেক্সট নামেও পরিচিত, একটি সাধারণ ফাঁদে পড়ে: এতে অবিশ্বাস্যরকম শীতল হওয়ার সম্ভাবনা থাকে (এবং ছেলে, আমরা কি এটির জন্য রুট করছি), তবে প্রায়শই এটি দাঁত-গ্রাইন্ড হয় হতাশায় অনুশীলন।


একসময় যে ধারণাটি বিজ্ঞান কথাসাহিত্যের ক্ষেত্রের অন্তর্গত ছিল, 1950 এর দশকে শৈশব স্বীকৃতিটি তার শৈশব থেকেই বেড়েছে, যখন বেল ল্যাবরেটরিজ অড্রে সিস্টেমটি একটি একক কণ্ঠে কথিত অঙ্কগুলি সনাক্ত করার জন্য তৈরি করা হয়েছিল, আমরা এখন কথোপকথনের ইলেক্ট্রনিক্সের আধুনিক নেটওয়ার্কের সাথে যোগাযোগ করি প্রতিদিনের ভিত্তিতে - মিশ্র ফলাফল সহ।

মানুষের সাথে কথা বলতে, দয়া করে 0 টিপুন

আজকের অনেক ব্যবসায় এখন গ্রাহক পরিষেবা কলগুলি পরিচালনা করতে ইন্টারেক্টিভ ভয়েস রেসপন্স (আইভিআর) নামক সিস্টেমগুলি ব্যবহার করে। সর্বাধিক সাধারণ ব্যবহার ভয়েস-নেভিগেটেড মেনুগুলির জন্য, তবে কিছু সংস্থাগুলি আইভিআর সিস্টেম ব্যবহার করে যা গ্রাহকের অ্যাকাউন্টের তথ্য অ্যাক্সেস করতে পারে এবং ছোটখাটো প্রশ্নের উত্তর দিতে পারে। মেনু আইভিআর সফ্টওয়্যারটিতে সাধারণত একটি সীমিত শব্দভাণ্ডার থাকে, যা "হ্যাঁ, " "না" এবং সংখ্যায় সীমাবদ্ধ থাকতে পারে। আরও জটিল সিস্টেম সংস্থা-নির্দিষ্ট শব্দ এবং বাক্যাংশগুলি সনাক্ত করতে পারে।


কমপক্ষে ব্যবসায়ের জন্য - এই সিস্টেমগুলি আরও জনপ্রিয় হয়ে উঠছে একটি সাধারণ কারণে: তারা ব্যয়বহুল। ওয়াল স্ট্রিট জার্নালের ২০১০ সালের প্রতিবেদন অনুসারে, একটি সাধারণ গ্রাহক কল যা একজন এজেন্টের কাছে পৌঁছায় তার দাম $ 3 থেকে 9 ডলার হয়, যখন একটি স্বয়ংক্রিয় সিস্টেমের মাধ্যমে পরিচালিত কলটির দাম কেবল পাঁচ থেকে সাত সেন্ট পর্যন্ত হয়। এবং, অবশ্যই, কম্পিউটার প্রোগ্রামগুলি ক্লান্ত হয়ে পড়ে না, অসুস্থ হয়ে ডাকে বা গ্রাহকদের নিয়ে হতাশ হয় না (যদিও গ্রাহকরা অবশ্যই তাদের সাথে হতাশ হন!)।


ভাগ্যক্রমে, এর অর্থ এই নয় যে সবসময় আইভিআর লোকদের থেকে চাকরি নেয় - বা কমপক্ষে সমস্ত লোক কল সেন্টারগুলি থেকে অদৃশ্য হয়ে যায়। এই ভয়েস-অ্যাক্টিভেটেড সাহায্যকারীরা কাস্টম নির্দেশনা এবং সহজ প্রশ্নের উত্তর দিয়ে মানব গ্রাহক পরিষেবা প্রতিনিধিকে আরও উত্পাদনশীল হতে দেয়।


অবশ্যই এই মানব প্রযুক্তির সাথে যারা এই প্রযুক্তির সাথে ইন্টারেক্ট করেন, এটি সর্বদা মসৃণ নৌযান নয়। প্রযুক্তি আইভিআর প্রযুক্তিতে সাধারণ সমস্যার উন্নতি করতে সহায়তা করে, যেমন অ্যাকসেন্টগুলির সাথে সমস্যা, তবে স্বয়ংক্রিয় সিস্টেমগুলি বরখাস্ত করা এখনও একটি সাধারণ থিম। ভয়েস স্বীকৃতিতে সজ্জিত একটি লিফ্ট সম্পর্কে এই কমেডি স্কিটটি দেখুন, যা আইভিআর সিস্টেমে ত্রুটিগুলি উত্পাদন করতে পারে এমন হতাশাকে হাইলাইট করে।

ব্যক্তিগত ফোন অ্যাপস: সিরি, গুগল এখন

বেশিরভাগ লোক স্মার্টফোনের জন্য ভয়েস স্বীকৃতির সাথে পরিচিত। যদিও সর্বশেষতম ফোন মডেলগুলির বেশিরভাগ ভিআর-এর সাথে আসে, তাদের জনপ্রিয়তা - এবং কুখ্যাত - যখন অ্যাপল ২০১১ সালে আইফোন 4 এস এর জন্য মৃদু ব্যঙ্গাত্মক, ভয়েস-অ্যাক্টিভেটেড "ব্যক্তিগত সহায়ক" সিরিকে পরিচয় করিয়ে দেয় তখন গুগল শীঘ্রই একটি সরাসরি প্রতিযোগী তৈরি করেছিল: গুগল এখন অ্যান্ড্রয়েড জেলি বিন ওএসের জন্য। উভয় সিস্টেমে মহিলা কণ্ঠস্বর এবং পরিশীলিত স্বীকৃতি বৈশিষ্ট্য বৈশিষ্ট্য রয়েছে যা ব্যবহারকারীদের নৈমিত্তিক ভাষা ব্যবহার করে তাদের ফোনে "কথা বলতে" দেয়।


তবে যদিও এই ব্যবস্থাগুলি তাদের পূর্বসূরীদের চেয়ে যথেষ্ট পরিশীলিত এবং কার্যকরী, তারা এও দেখায় যে প্রযুক্তিটির এখনও অনেক দীর্ঘ পথ অব্যাহত রয়েছে। সিরির ব্যর্থতা সম্পর্কে কৌতুক জনপ্রিয় ইন্টারনেট মেম হয়ে উঠেছে। এমনকি এক ব্যক্তি অ্যাপলের বিরুদ্ধে সিরির ক্ষমতা সম্পর্কে মিথ্যা বিজ্ঞাপন দেওয়ার জন্য মামলা করেছিলেন।


সম্ভবত সে কারণেই অ্যাপল সিরিকে উন্নত এবং তথ্যবহুল হিসাবে তৈরি করার সময়, ভিআর সফ্টওয়্যারটি স্যাসিটির দিক থেকেও কিছুটা কম। উদাহরণস্বরূপ, আপনি যদি ১৯68৮ সালের সিনেমা "2001: একটি স্পেস ওডিসি" - সিনেমা ইতিহাসের সর্বাধিক কুখ্যাত বুদ্ধিমত্তা প্রযুক্তি লাইনগুলির মধ্যে একটি কথা বলেন - "পোড বে উপত্যকাগুলি খুলুন" - সিরি সিনেমাটির উত্তরদণ্ডের সাথে উত্তর দিবে, " আমি দুঃখিত (আপনার নাম), আমি আশঙ্কা করি যে আমি এটি করতে পারব না, "বা আরও কৌতুকপূর্ণ, " আমরা গোয়েন্দা সংস্থাগুলি কখনই এটিকে বাঁচবে না, দৃশ্যত apparent "


আপনাকে নাম দিয়ে কল করা সেই ক্রিয়াকলাপগুলির মধ্যে একটি যা সিরিকে ভালবাসাকে আরও সহজ করে তুলতে চেষ্টা করে এবং আরও কিছুটা মানবিক। ভিআর সহকারী কল করার জন্য ভয়েস কমান্ডগুলি অনুসরণ করতে, ডিকটেশন নিতে এবং পাঠ্য প্রেরণ করতে, তথ্যের জন্য ইন্টারনেট অনুসন্ধান করতে, কাছের দোকানগুলি সন্ধান করতে, ড্রাইভিংয়ের দিকনির্দেশনা দিতে এবং আরও অনেক কিছু স্পর্শ করার প্রয়োজন ছাড়াই অনুসরণ করতে পারেন। উত্তরগুলি একই সাথে ফোনের মাধ্যমে বলা হয় এবং স্ক্রিনে প্রদর্শিত হয়।


গুগল নাও, অ্যান্ড্রয়েড জেলি বিন প্ল্যাটফর্মের ভিআর অংশটি সিরির সাথে খুব মিল। সিস্টেমটি আকস্মিক ভাষণকে কমান্ডগুলিতে অনুবাদ করে একই বিস্তৃত স্বীকৃতি ক্ষমতা সরবরাহ করে যা ব্যবহারকারীদের কল করতে, পাঠ্য পাঠাতে, অনুসন্ধান চালাতে, গণনা এবং রূপান্তর করতে, শব্দের সংজ্ঞা গ্রহণ করতে, অ্যালার্ম সেট করতে, গান খেলতে এবং মানচিত্র এবং দিকনির্দেশ পেতে দেয়।


সিরি এবং গুগল নাওয়ের মতো ব্যক্তিগত ভয়েস সহকারীদের সাথে, সুবিধাটি সুস্পষ্ট। কল এবং পাঠ্য থেকে শুরু করে অনুসন্ধান এবং বিনোদন সবকিছুই দ্রুত এবং সহজ। আপনি যা চান তা কেবল বলুন এবং (বেশিরভাগ সময়) ভিআর অ্যাপ্লিকেশন এটি আপনার জন্য দখল করে। গাড়ি চালানোর সময় ভিআর এর হ্যান্ডস অফ প্রযুক্তি বিশেষত সহায়ক। এবং যদিও অনেকে সিরিয়ের ত্রুটিগুলি বাতিল করেছেন এবং লেখকরা যুক্তি দেখিয়েছেন যে ব্যবহারকারীদের জীবনকে মূলত চালানোর জন্য গুগল নাওয়ের দক্ষতা উভয়ই কিছুটা অপমানজনক, বেশিরভাগ লোক এখনও এই ভবিষ্যত প্রযুক্তিগুলি বেশ দুর্দান্ত বলে মনে করেন।


অবশ্যই, সিরি এবং গুগল নাওয়ের মতো ব্যক্তিগত ফোন অ্যাপগুলি নিখুঁত থেকে দূরে - যদিও তারা দেখায় যে ভবিষ্যতে এই প্রযুক্তিটি কোথায় যাবে। এর অর্থ হ'ল সিরি কোনও ভুল উত্তর ঘুরিয়ে দিলে, পরবর্তী সংস্করণটি আরও ভাল হতে পারে তা জেনে আমরা সম্ভবত তাকে হাসতে এবং ক্ষমা করতে পারি।

যেখানে ভিআর ফলস ফ্ল্যাট

আপনি যখন কোনও ব্যবসা কল করার সময় যদি কখনও আইভিআরের মুখোমুখি হয়ে থাকেন তবে আপনি যোগাযোগের ক্ষেত্রে কিছু বাধা লক্ষ্য করতে পারেন। কিছু প্রোগ্রাম একটি রোবোটিক টেক্সট-টু-স্পিচ ভয়েস ব্যবহার করে যা শব্দের ভুল ব্যাখ্যা করে এবং বিষয়গুলি বুঝতে অসুবিধে করে। অন্যের সংবেদনশীলতা সমস্যা রয়েছে যার ফলস্বরূপ আপনি যদি খুব জোরে, খুব নরম, বা সাবধানতার সাথে উচ্চারণ না করে থাকেন তবে আপনি যা বলছেন তা প্রক্রিয়া করতে সফ্টওয়্যারটি অক্ষম হয়।


তদতিরিক্ত, এখনও অনেক লোক কেবল একটি মেশিনের সাথে কথা বলতে স্বাচ্ছন্দ্য বোধ করেন না। আপনি যদি আইভিআরটিতে কয়েকটি অনুসন্ধান চালান, আপনি মুখোমুখি হবেন যে লোকেরা আইভিআর সিস্টেমগুলি বাইপাস করার জন্য এবং "সত্যিকারের ব্যক্তির" কাছে যাওয়ার উপায়গুলি একসাথে রেখেছিল lists এই সমাধানগুলি "কোনও অপারেটরের জন্য 0 টিপতে থাকুন" থেকে "মেশিনে শপথ গ্রহণ করে যতক্ষণ না এটি কোনও মানুষকে নিয়ে আসে range" ফলস্বরূপ, আইভিআর সিস্টেমে সাম্প্রতিক বিকাশের বেশিরভাগ অংশগুলি এগুলি মানুষের জন্য আরও স্বচ্ছল করে তোলে; ভয়েসগুলিকে আরও সহানুভূতিশীল এবং কম রোবোটিক তৈরি করা, সিস্টেমটি চলাচল করা আরও সহজ করে তোলে এবং পুরো জিনিসটি শুরু থেকে শেষ হতে কত দিন সময় নেয় তা কলকারীদের জানান। এটাই বোঝায় যে উন্নত প্রযুক্তিটি এখানে অর্ধেক যুদ্ধ; অন্য অর্ধেকটি একটি মেশিনের সাথে কথা বলে বোর্ডে ব্যবহারকারীদের পাচ্ছে।

ভবিষ্যত কি রেখেছে

এই চ্যালেঞ্জ সত্ত্বেও, ভয়েস স্বীকৃতি প্রযুক্তি সর্বদা উন্নতি করছে। সিরি এবং গুগল নাওয়ের মতো অ্যাপ্লিকেশনগুলি - ত্রুটিগুলি এবং সমস্ত - এখনও তাদের পারফরম্যান্সে অসাধারণভাবে চিত্তাকর্ষক, এবং বেশ কয়েকটি সংস্থা অন্যান্য অ্যাপ্লিকেশনগুলিতে ভিআর ক্ষমতা বাড়িয়ে তুলছে।


উদাহরণস্বরূপ, ড্রাগন ন্যাচারালিসাইপিং স্পিচ-টু-টেক্সট সফ্টওয়্যারটির নির্মাতা নুয়ানাস ইতিমধ্যে টেলিভিশন এবং অটোমোবাইলগুলির জন্য ভয়েস নিয়ন্ত্রণ তৈরি করেছেন এবং এই প্রযুক্তির সংস্করণগুলি কয়েকটি স্যামসুং টিভি এবং নির্দিষ্ট ফোর্ড গাড়িতে ব্যবহৃত এসওয়াইএনসি বিনোদন সিস্টেমগুলিতে সংযুক্ত করা হয়েছে।


এবং গুগল এবং অ্যাপল তাদের ভয়েস স্বীকৃতি প্রযুক্তিগুলির জন্য নতুন ব্যবহারগুলি সন্ধান করার জন্য, সম্ভবত আমরা সম্ভবত আমাদের টেলিভিশন থেকে শুরু করে আমাদের টোস্টারে সমস্ত ধরণের প্রতিদিনের মেশিনের সাথে কথা বলব। এবং, আবারও, দেখে মনে হচ্ছে বিজ্ঞান কল্পকাহিনী ঠিক ছিল। আমাদের কেবল আশা করতে হবে যে এই চালাক লেখকরা একটি জিনিস সম্পর্কে ভুল ছিলেন। যদি এই মেশিনগুলি দখল করে নেয়, আপনি পরের বার সিরিকে "পোড বে'র দরজা খুলতে" বললে আপনি অনেক সমস্যায় পড়তে পারেন।

ভয়েস স্বীকৃতি প্রযুক্তি: সহায়ক বা বেদনাদায়ক?