فناوری

پروفسور ایرانی که جستجوی داده‌ها رو ۴۰ برابر سریع‌تر کرد!

تصور کن تو یه کتابخونه عظیم با میلیاردها کتاب گشتی و بخوای یه کتاب پیدا کنی که حس و حال همون داستان مورد علاقه‌ت رو داشته باشه. حالا اینو تو دنیای دیجیتال تصور کن: میلیاردها عکس، متن و صدا! پیدا کردن چیزی که شبیهش بخوای، مثل پیدا کردن سوزن تو انبار کاهه. اما پروفسور وهاب میررکنی، دانشمند ایرانی و برنده جایزه مصطفی (ص) ۲۰۲۵، یه الگوریتم جادویی ساخته که این کارو ۴۰ برابر سریع‌تر از روش‌های قدیمی انجام می‌ده!

این قهرمان علم داده کیه؟

پروفسور میررکنی، استاد باحال دانشگاه‌های نیویورک و گوگل، جایزه مصطفی(ص) (که مثل جایزه نوبل علمی تو جهان اسلامه ) رو به خاطر الگوریتمش برد. این الگوریتم با توزیع‌های p-پایدار و یه روش خفن به اسم Locality-Sensitive Hashing (LSH) داده‌های شبیه به هم رو تو یه چشم به هم زدن پیدا می‌کنه. از پیشنهاد فیلم تو نتفلیکس تا پیدا کردن الگوهای بیماری تو پزشکی، این الگوریتم همه‌جا کاربرد داره!

شباهت چطور کار می‌کنه؟

تو دنیای کامپیوتر، همه‌چیز عددِ! یه عکس؟ یه عالمه عدد برای پیکسل‌هاش. یه آهنگ؟ عددهای فرکانس صدا. برای پیدا کردن شباهت، کامپیوتر فاصله بین این عددها رو اندازه می‌گیره:

  • فاصله اقلیدسی (p=2): مثل یه خط مستقیم بین دو نقطه، برای نگاه کلی و سریع.
  • فاصله منهتنی (p=1): مثل قدم زدن تو خیابونای شهر، برای دقت بیشتر.

میررکنی نشون داد حتی با p کمتر از ۱ (که قبلاً فکر می‌کردن به درد نمی‌خوره) می‌شه جستجو رو سریع کرد، بدون از دست دادن دقت!

راز سرعت ۴۰ برابری چیه؟

روش‌های قدیمی مثل kd-tree مثل اینه که تک‌تک کتابای کتابخونه رو باز کنی، خیلی طول می‌کشه! اما روش LSH مثل یه جادوگر عمل می‌کنه:

  1. هشینگ هوشمند (LSH): داده‌های بزرگ رو به کدهای کوتاه تبدیل می‌کنه، مثل خلاصه‌نویسی یه کتاب. داده‌های شبیه به هم، کدهای شبیه می‌گیرن.
  2. توزیع‌های p-پایدار: این فرمول‌های ریاضی کمک می‌کنن فاصله‌ها سریع تخمین زده بشن. مثلاً برای p=2، از توزیع گاوسی استفاده می‌کنه تا بگه “این دو تا شبیه‌ان!”
  3. نتیجه؟ تو آزمایش‌ها، این روش جستجو رو تا ۴۰ برابر سریع‌تر از روش‌های قدیمی کرد، حتی تو شرایط سخت!

چرا این مهمه؟

این الگوریتم مثل یه میان‌بر تو دنیای پر از داده‌ست. تو گوگل، اینستا، یا حتی تو بیمارستان‌ها، حالا می‌تونی سریع‌تر چیزایی که می‌خوای رو پیدا کنی، از آهنگای مشابه تا تشخیص بیماری. پروفسور می‌گه: «کنجکاو باشین و تسلیم نشین! تو دنیای دیجیتال، جوون‌ها می‌تونن تو یه سال ستاره بشن!»

تو چی فکر می‌کنی؟ دوست داری تو دنیای داده‌ها کاوش کنی؟ کامنت بذار و بگو کدوم بخشش باحال‌تر بود!

سرعت نور تو دنیای داده‌ها!

رضا خلف چعباوی

به نام خدا - سلام، سابقه‌ی نوشتن بیش از 3000 مطلب گیمینگ و نویسندگی در بزرگ‌ترین سایت‌های ایران. بازی‌های مورد علاقه: Metal Gear Solid 3، سری Devil May Cry، فرنچایز Yakuza: Like a Dragon و Gravity Rush. ایمیل کاری: khc.reza@gmail.com

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا