پروژه GFT | چرا گوگل در پیش‌بینی اپیدمی و پاندمی موفق نشد؟



ضمیمه اهداف و انتظارات آموزشی این دوره کد درس: 266621 ما همیشه به دیدن موفقیت شرکت های بزرگ و موفق عادت کرده ایم. آمازون، اپل، گوگل و مایکروسافت برخی از بزرگترین شرکت های فناوری جهان هستند که اغلب به عنوان نمونه های موفقیت ذکر می شوند. اما شرکت ها معمولا محدود به یک پروژه یا یک محصول نیستند. اکثر آنها چندین پروژه را اجرا کرده اند و برخی از آنها شکست خورده است. اپل در تولید دستیارهای دیجیتال کوچک (PDA) موفق نبود و محصولش که نیوتن نام داشت، چنان شکست خورد که امروزه کمتر کسی نام آن را شنیده است. آمازون همچنین نتوانست گوشی های فایرفاکس را راه اندازی کند. مایکروسافت همچنین در چندین پروژه از جمله Windows Me و Windows برای تلفن های همراه شکست خورد. مطالعه محصولات شکست خورده کمتر از مطالعه محصولات موفق مفید نخواهد بود. در اینجا می خواهیم داستان یکی از محصولات شکست خورده گوگل را بیان کنیم. شما می توانید این درس را مستقل از سایر دروس تکمیلی بخوانید. اما احتمالاً اگر یکی از درس‌های زیر را بخوانید این داستان برایتان جالب‌تر خواهد بود: این جمله به مارک تواین (و بسیاری از نویسندگان دیگر) نسبت داده شده است: «پیش‌بینی آن سخت است؛ «به‌خصوص اگر درباره آینده باشد. اگرچه این جمله کمی طنز به نظر می رسد، اما واقعاً نوعی پیش بینی وجود دارد که به آینده مربوط نمی شود؛ چیزی که به آن Nowcasting می گویند و ممکن است به فارسی به عنوان Nowabing ترجمه شود. فرض کنید برای فردا انتخابات تعیین شده است و شما به دنبال آن هستید. برای راهی که بدانیم مردم فردا به چه کسی رای خواهند داد. اکثر رای دهندگان در ساعات یا روزهای آخر برگه رای خود را تغییر نمی دهند. بنابراین اگر بتوانید همین الان رای مردم را بگویید، تقریباً می توانید از نتیجه انتخابات مطلع شوید. با توجه به پراکندگی و تنوع مردم، هیچ راه دقیقی برای دانستن نظرات آنها وجود ندارد. بنابراین باید سعی کنید “پیش بینی کنید که در حال حاضر چه اتفاقی افتاده است” (+). آنچه در دوران کرونا اتفاق افتاد و شهرهای کشور به رنگ های مختلف تقسیم شدند ( قرمز، زرد و 5) نمونه دیگری از Nowcasting است. ما در مورد آنچه در حال حاضر یا در آینده نزدیک اتفاق افتاده صحبت می کنیم، اما باید به محاسبات و برآوردها تکیه کنیم. زیرا آمار بیماری همه افراد در دسترس نیست و نمی توان به آن دست یافت. گوگل در سال 2008 به دنبال تشخیص شیوع آنفولانزا بود، زمانی که گوگل اعلام کرد با بررسی جستجوهای اینترنتی افراد می تواند تشخیص دهد که آنفولانزا در کجا شیوع بیشتری دارد و کجا شیوع دارد. گوگل این محصول جدید را Google Flu Trends نامید که معمولاً GFT نامیده می شود. قرار بود سرویس گوگل جدا از اینکه یک محصول مستقل است، نشانه ای از اهمیت و کاربرد کلان داده در حوزه های مختلف به ویژه در حوزه سلامت باشد. در نتیجه، گوگل برخلاف رویه معمول خود، مقاله ای را در مجله Nature منتشر کرد. این مقاله توسط جرمی گینزبرگ و متیو محبی و چند تن دیگر ویرایش شده است (فایل PDF مقاله). آن مقاله توضیح داد که سالانه حدود 500000 نفر در سراسر جهان بر اثر آنفولانزا جان خود را از دست می دهند. علاوه بر این، جهش های مختلف ویروس آنفولانزا باعث ظهور انواع یا گونه های جدید ویروس آنفولانزا می شود. این سویه‌های جدید به طور بالقوه می‌توانند منبع همه‌گیری‌های بزرگ باشند. بنابراین، اگر رفتارهای انسانی در زمینه پیگیری سلامت فردی در نقاط مختلف جهان به طور مداوم رصد شود، می توان شیوع گسترده آنفولانزا را زودتر تشخیص داد و اقدامات لازم را برای کنترل بیماری انجام داد. کارشناسان گوگل در آن مقاله توضیح دادند که یکی از راه‌های مطالعه رفتار انسان این است که به جستجوی آنفولانزا نگاه کنیم. به طور خلاصه، اگر مردم منطقه ای از کشور بیش از هر زمان دیگری عباراتی مانند آبریزش بینی، قیمت دماسنج پزشکی، قرص سرماخوردگی و مواردی از این قبیل را جستجو کنند، می توان حدس زد که میزان آنفولانزا در منطقه رشد کرده است. انتخاب سوالات آنفلوانزا طبیعتاً وقتی گوگل وارد یک بازی تحلیلی می شود و ادعا می کند که می خواهد یک پروژه تحقیقاتی را با حجم زیادی از داده هایی که دارد اجرا کند، انتظار ندارید چند نفر دور هم بنشینند و عبارات مربوط به آنفولانزا را “حدس بزنند”. »بزنند. گوگل هم همین کار را نکرد. همانطور که گینزبرگ و همکاران. در مقاله خود عنوان می کنند “گوگل به میلیاردها جستجوی انسانی دسترسی دارد” و منطقی است که از روش های علمی و آماری برای پاسخ به سوالات و عبارات مرتبط با آنفولانزا استفاده کنید. می دانیم که CDC ایالات متحده به طور مرتب آماری را در مورد شیوع بیماری های مختلف از جمله آنفولانزا منتشر می کند. گوگل این داده ها را در کنار داده های جستجوی کاربران قرار داده است و از روشی تحلیلی و آماری استفاده کرده است تا تشخیص دهد کدام عبارات در زمان شیوع آنفولانزا بیشتر جستجو شده اند. هنگامی که این عبارات در هر نقطه از زمان شناسایی شدند، می توان شیوع آنفولانزا را با توجه به نوسانات جستجوی آنها تخمین زد. پس از بررسی دقیق داده‌های سال‌های 2003 تا 2008، گوگل توانست 50 میلیون درخواست جستجو را به 45 کاهش دهد و با اطمینان گفت: » همانطور که در نمودار بالا مشاهده می‌کنید – در مقاله گینزبرگ و محبی – محققان گوگل به این نتیجه رسیدند. که نظارت و کنترل 45 کلمه کلیدی حتی بهتر از 80 یا 90 کلمه کلیدی است. به عبارت دیگر، ضریب همبستگی بین “جستجوی عبارت” و “شیوع بیماری” زمانی به اوج خود می رسد که تنها 45 جستجوی عبارت به طور دائم نظارت شود. گوگل در سال 2008 به طور رسمی آنفولانزا را در مناطق مختلف ایالات متحده در Google Flu Trends گزارش کرد و این سرویس در آن سال ها به نمادی از قدرت داده های بزرگ تبدیل شد. GFT چیزی بیش از یک محصول بود. بسیاری از تحلیلگران GFT را آغاز عصر جدیدی می دانستند. دورانی که قرار بود کلان داده در خدمت سلامت و رفاه عمومی باشد. کافی است به کتاب داده های بزرگ Sch Datanberger نگاه کنید تا ببینید پروژه گوگل چقدر خوش بینانه بوده است (+). نتیجه GFT چه بود؟ شما هنوز در این بحث شرکت نکرده اید. برخی از دوستان متمم که به این درس علاقه دارند:،،،، ترتیبی که متمم پیشنهاد می کند مطالب مجموعه داستان کسب و کار را مطالعه کنید: چند مقاله پیشنهادی از متمم: سری مطالب داستان کسب و کار

دیدگاهتان را بنویسید