الهام قاسمی
دانشجوی دکتری بیوتکنولوژی
تحلیلگر داده های علوم زیستی و داده های عظیم ( Big Data)
مسلط به الگوریتم های یادگیری ماشین و پردازش داده شامل:
طبقه بندی (classification)، خوشه بندی (clustering) و پیش بینی (prediction)
علاقمند به زبان های برنامه نویسی به خصوص زبان های برنامه نویسی پایتون و متلب
داده کاوی فرآیندی است که منجر به کشف همبستگی ها و الگوهای مفید و روند های منظم و پنهان در مجموعه داده های عظیم میگردد. در اصطلاح عامیانه تر استخراج دانش از معدن داده را داده کاوی میگویند که این کار با الگوریتم ها و سازوکارهای هوشمند انجام میگیرد. با پیشرفت روزافزون علم و تکنولوژی، کلان داده ها با سرعت و تنوع بسیار بالاتری تولید میشوند و تکنیک های سنتی پردازش داده را به چالش کشیده اند. تفاوت اصلی علم آمار و داده کاوی در حجم داده های مورد تحلیل، روش های مدلسازی و دستیابی به اطلاعات پنهان و ارزشمند است که با کمک هوش مصنوعی و شیوه های خودکار یادگیری ماشینی انجام می شود و به کاربران این اجازه را می دهد که بر اساس داده های واقعی ارزیابی ها را انجام دهند و تصمیمات هوشمندانه اتخاذ کنند.
داده کاوی پزشکی (Medical datamining) : پزشکی مدرن حجم انبوهی از داده ها را درزمینه های مختلف تولید میکند. داده کاوی دارای قابلیت تجزیه و تحلیل داده های عظیم خام یا چند بعدی است که درداده پایگاه های پزشکی و کلینیکی ذخیره میشود واز مراکز پزشکی و بیمارستان ها جمع آوری میشود. این دانش توانایی کشف الگوهای منظم دخیل در ایجاد بیماری، کشف همبستگی بین ویژگی های مختلف از قبیل داده های شخصی بیماران، علایم بیماری و… را دارد. یکی ازجنبه های مهم داده کاوی در تشخیص دقیق بیماری ها و انتخاب درمان مناسب برای بیماران و پیش آگهی بیماری است که از اهمیت بالایی در علم پزشکی برخوردار است و باعث بهبود کیفیت تصمیم گیری پزشکی، کمینه کردن خطاهای پزشکی و کاهش هزینه و زمان تشخیص بیماری و رضایت بیماران می شود.در این زمینه تیم داده کاوی آرتان با بهره گیری ازالگوریتم های یادگیری ماشین جهت تشخیص دقیق، زودهنگام و پیش آگهی بیماری های سخت و ناتوان کننده از قبیل انواع سرطان ها ، بیماری های سیستم عصبی مرکزی (ام اس، زوال عقل، صرع و..) اختلال دوقطبی، اختلال بیش فعالی-کمبود توجه در کودکان، سکته قلبی و مغزی، دیابت و... آماده همکاری با پزشکان و اساتید محترم هیأت علمی و سایر عزیزانی که در این حیطه فعالیت می کنند می باشد که می تواند نمودی از ابرروند آینده پزشکی با عنوان CDSS باشد.
بازاریابی/ فروش ( Marketing&Sales): پیشرفتها در زمینه داده کاوی تاثیرات عمیقی بر بازریابی شرکت ها داشته است. شرکتها از این اطلاعات برای تبلیغات و فروش خود به مشتریان استفاده می کنند و این تاکتیک بازاریابی موثرتر و کارآمدتر است و باعث صرفه جویی در هزینه شرکت ها می شود. نمونه بارز آن سایت آمازون است که از داده های جمع آوری شده برای بهبود خدمات مشتری استفاده می کند و محصولات خود را بر حسب علاقه مشتری پیشنهاد می دهد. فروشگاهای بزرگ و زنجیره ای نیز میتوانند با بهره گیری از داده های فروشگاهی در طبقه بندی محصولات پرفروش، لیست علاقه مندی مشتریان و حتی چیدمان قفسه های فروشگاه خود خدمات خود به مصرف کنندگان را به میزان بالایی بهبود ببخشند.
بانکداری ( Banking): رقابت بانکی روز بروز گسترده تر می شود و بانکها برای بدست آوردن و حتی حفظ سهام بازار باید خلاقانه تر و فعالتر مبارزه کنند. Big Data تاکنون درآمدهای زیادی رابرای شرکتهای بانکی ایجاد کرده است و در سالهای آینده چیزهای بیشتری برای ارائه دارد. بانکهای پیشرو از ابزارهای داده کاوی برای طبقه بندی مشتریان، اعتبارسنجی و تأیید آنها، حفظ مشتریان بخصوص مشتریان تأثیرگذار (VIP)، پیش بینی عدم پرداخت بدهی ها، بازاریابی و شناسایی الگوهای کلاهبرداری استفاده می کنند
Bank of America یک شرکت سرمایه گذاری چند ملیتی آمریکایی و خدمات مالی است. این بانک دارای هفتاد میلیون مشتری است. در سال 2008 بعد از آنکه متوجه شدند با سرعت نگران کننده ای مشتریان خود را از دست میدهند برآن شدند تا با استفاده از آنالیز های داده کاوی تقلب یا کلاهبرداری و همچنین مشتریان کم درآمد را شناسایی کرده و با اتخاذ تصمیمات هوشمندانه و راه اندازی وبسایت آنلاین و تدابیر دیگر تواستند در طی دوسال به میزان 400 درصد بازگشت سرمایه داشته باشند.
Danske BanK با داشتن بیش از 5 میلیون نفر مشتری، بزرگترین بانک در دانمارک است. این بانک با استفاده از روشهای کشف تقلب قدیمی تنها قادر به شناسایی 40% تخلف در روز بود که این آمار برای آنها نگران کننده بود . بنابراین نیاز به یک اقدام فوری بود و آنها با یک شرکت داده کاوی قرار داد بستند و با تجزیه تحلیل داده های کلان خود علاوه بر افزایش شناسایی نرخ تقلب به میزان 80%، سود عملیاتی گسترده 70 میلیون دلاری را در سال 2018 مشاهده کردند.
کشاورزی دقیق ( precision agriculture): از حدود 100 سال تبدیل کشاورزی سنتی به صنعتی تحول بزرگی در حوزه کشاورزی ایجاد کرد و در عصر حاضر دیجیتالی شدن چهره کشاورزی را بسیار بهبود می بخشد. تقریبا 40% از سطح زمین برای تولیدات محصولات کشاورزی استفاده می شود ولی در کمال تعجب حجم وسیعی از آنها از بدلایل مختلف از بین میروند. در این میان داده کاوی و استفاده ازBig Data واقعی نقش کلیدی در ایجاد یک سیستم کشاورزی پیشرفته و هوشمند ایفا می کند . این آنالیز ها میتوانند از طریق نظارت بر روند های طبیعی از قبیل طوفان ها، تغییرات آب و هوایی و آفات و بیماریها که می تواند منجر به از بین رفتن کل محصول گردد، از طریق پیش بینی و تشخیص به موقع به بخش کشاورزی کمک کند. کشاورزان می توانند از تکنیک های تحلیلی پیش بینی شده برای برنامه ریزی و عمل براساس الگوهای آب وهوا، تقاضای مصرف کننده و روند استفاده کنند. این داده ها به آنها کمک می کند تا درک کنند که جهان اطراف چه تاثیری بر صنعت کشاورزی دارد. چه باید کاشت، بهترین زمان چیست، آیا قیمت لوازم افزایش می یابد و این چگونه بر سود تأثیر می گذارد. همه این موارد نیازبه ایجاد یک صنعت داده محور را تأیید می کند که باید به شیوه های جدید و ابتکاری عمل کند.