پروفسور ایرانی که جستجوی دادهها رو ۴۰ برابر سریعتر کرد!
تصور کن تو یه کتابخونه عظیم با میلیاردها کتاب گشتی و بخوای یه کتاب پیدا کنی که حس و حال همون داستان مورد علاقهت رو داشته باشه. حالا اینو تو دنیای دیجیتال تصور کن: میلیاردها عکس، متن و صدا! پیدا کردن چیزی که شبیهش بخوای، مثل پیدا کردن سوزن تو انبار کاهه. اما پروفسور وهاب میررکنی، دانشمند ایرانی و برنده جایزه مصطفی (ص) ۲۰۲۵، یه الگوریتم جادویی ساخته که این کارو ۴۰ برابر سریعتر از روشهای قدیمی انجام میده!
این قهرمان علم داده کیه؟
پروفسور میررکنی، استاد باحال دانشگاههای نیویورک و گوگل، جایزه مصطفی(ص) (که مثل جایزه نوبل علمی تو جهان اسلامه ) رو به خاطر الگوریتمش برد. این الگوریتم با توزیعهای p-پایدار و یه روش خفن به اسم Locality-Sensitive Hashing (LSH) دادههای شبیه به هم رو تو یه چشم به هم زدن پیدا میکنه. از پیشنهاد فیلم تو نتفلیکس تا پیدا کردن الگوهای بیماری تو پزشکی، این الگوریتم همهجا کاربرد داره!
شباهت چطور کار میکنه؟
تو دنیای کامپیوتر، همهچیز عددِ! یه عکس؟ یه عالمه عدد برای پیکسلهاش. یه آهنگ؟ عددهای فرکانس صدا. برای پیدا کردن شباهت، کامپیوتر فاصله بین این عددها رو اندازه میگیره:
- فاصله اقلیدسی (p=2): مثل یه خط مستقیم بین دو نقطه، برای نگاه کلی و سریع.
- فاصله منهتنی (p=1): مثل قدم زدن تو خیابونای شهر، برای دقت بیشتر.
میررکنی نشون داد حتی با p کمتر از ۱ (که قبلاً فکر میکردن به درد نمیخوره) میشه جستجو رو سریع کرد، بدون از دست دادن دقت!
راز سرعت ۴۰ برابری چیه؟
روشهای قدیمی مثل kd-tree مثل اینه که تکتک کتابای کتابخونه رو باز کنی، خیلی طول میکشه! اما روش LSH مثل یه جادوگر عمل میکنه:
- هشینگ هوشمند (LSH): دادههای بزرگ رو به کدهای کوتاه تبدیل میکنه، مثل خلاصهنویسی یه کتاب. دادههای شبیه به هم، کدهای شبیه میگیرن.
- توزیعهای p-پایدار: این فرمولهای ریاضی کمک میکنن فاصلهها سریع تخمین زده بشن. مثلاً برای p=2، از توزیع گاوسی استفاده میکنه تا بگه “این دو تا شبیهان!”
- نتیجه؟ تو آزمایشها، این روش جستجو رو تا ۴۰ برابر سریعتر از روشهای قدیمی کرد، حتی تو شرایط سخت!
چرا این مهمه؟
این الگوریتم مثل یه میانبر تو دنیای پر از دادهست. تو گوگل، اینستا، یا حتی تو بیمارستانها، حالا میتونی سریعتر چیزایی که میخوای رو پیدا کنی، از آهنگای مشابه تا تشخیص بیماری. پروفسور میگه: «کنجکاو باشین و تسلیم نشین! تو دنیای دیجیتال، جوونها میتونن تو یه سال ستاره بشن!»
تو چی فکر میکنی؟ دوست داری تو دنیای دادهها کاوش کنی؟ کامنت بذار و بگو کدوم بخشش باحالتر بود!
سرعت نور تو دنیای دادهها!








