تکنولوژی

استفاده از هوش مصنوعی برای یافتن ناهنجاری های پنهان در مجموعه داده های عظیم در زمان واقعی

قطع برق آمریکا

یک تکنیک جدید یادگیری ماشینی می تواند خرابی های احتمالی شبکه برق و گلوگاه های ترافیکی آبشاری را در زمان واقعی شناسایی کند.

یک تکنیک جدید یادگیری ماشینی می‌تواند خرابی‌های بالقوه شبکه برق یا گلوگاه‌های ترافیکی در زمان واقعی را مشخص کند.

شناسایی خرابی شبکه برق سراسری می تواند مانند جستجوی سوزن در انبار کاه بزرگ باشد. صدها هزار حسگر متصل به هم در سراسر ایالات متحده جریان الکتریکی، ولتاژ و سایر اطلاعات حیاتی را در زمان واقعی ضبط می‌کنند و اغلب در هر ثانیه چندین ضبط می‌کنند.

دانشمندان z اسطوره– IBM Watson AI Lab یک روش محاسباتی کارآمد ایجاد کرده است که می تواند به طور خودکار ناهنجاری ها را در این جریان های داده در زمان واقعی تشخیص دهد. آنها نشان دادند که روش هوش مصنوعی آنها، که مدل‌سازی اتصالات شبکه برق را می‌آموزد، در تشخیص این خطاها بسیار بهتر از سایر تکنیک‌های رایج است.

از آنجایی که مدل یادگیری ماشینی که آنها توسعه داده‌اند به داده‌های ناهنجاری شبکه برق مشروح برای آموزش نیاز ندارد، استفاده از آن در موقعیت‌های دنیای واقعی که اغلب یافتن مجموعه‌های داده برچسب‌گذاری شده با کیفیت بالا دشوار است، آسان‌تر است. این مدل همچنین انعطاف‌پذیر است و می‌تواند در موقعیت‌های دیگری که تعداد زیادی حسگر به هم پیوسته داده‌ها را جمع‌آوری و گزارش می‌کنند، مانند سیستم‌های نظارت بر ترافیک، استفاده شود. برای مثال، می‌تواند گلوگاه‌های ترافیکی را شناسایی کند یا آبشاری از ترافیک را آشکار کند.

در مورد شبکه برق، مردم سعی کرده‌اند با استفاده از آمار، داده‌ها را جمع‌آوری کنند و سپس قوانین تشخیص را با دانش دامنه تعریف کنند تا بگویند، برای مثال، اگر ولتاژ یک درصد مشخص افزایش یابد، باید به اپراتور شبکه هشدار داده شود. چنین سیستم‌های مبتنی بر قوانین، حتی زمانی که با تجزیه و تحلیل داده‌های آماری کمک می‌کنند، به مقدار زیادی کار و دانش نیاز دارند. جی چن، محقق ارشد و مدیر آزمایشگاه هوش مصنوعی MIT-IBM واتسون می‌گوید: ما نشان می‌دهیم که می‌توانیم این فرآیند و همچنین الگوهای از داده‌ها را با استفاده از تکنیک‌های پیشرفته یادگیری ماشینی خودکار کنیم.

یکی از نویسندگان انیان دای، کارآموز آزمایشگاه هوش مصنوعی MIT-IBM واتسون و فارغ التحصیل دانشگاه ایالتی پنسیلوانیا است. این تحقیق در کنفرانس بین المللی بازنمایی یادگیری ارائه خواهد شد.

مطالعه احتمال

دانشمندان با تعریف ناهنجاری به عنوان رویدادی که احتمال وقوع آن بعید است، مانند افزایش ناگهانی ولتاژ، شروع کردند. آنها داده های شبکه برق را به عنوان یک توزیع احتمال در نظر می گیرند، بنابراین اگر بتوانند چگالی احتمال را تخمین بزنند، می توانند مقادیر کم چگالی را در مجموعه داده ها شناسایی کنند. کمترین محتمل ترین نقاط داده مربوط به ناهنجاری ها است.

تخمین این احتمالات کار آسانی نیست، به خصوص که هر نمونه سری های زمانی زیادی را پوشش می دهد و هر سری زمانی مجموعه ای از نقاط داده چند بعدی است که در طول زمان ثبت می شود. علاوه بر این، حسگرهایی که همه این داده‌ها را جمع‌آوری می‌کنند به یکدیگر وابسته هستند، به این معنی که در یک پیکربندی خاص به هم متصل هستند و گاهی اوقات یک سنسور می‌تواند روی دیگران تأثیر بگذارد.

برای درک توزیع احتمال شرطی پیچیده داده ها، محققان از نوع خاصی از مدل یادگیری عمیق به نام جریان عادی سازی استفاده کردند که به ویژه در تخمین چگالی احتمال یک نمونه موثر است.

آنها این را با عادی سازی مدل جریان با نوعی گراف، معروف به شبکه بیزی، گسترش دادند که می تواند ساختار پیچیده و علی رابطه بین حسگرهای مختلف را بیاموزد. چن توضیح می‌دهد که این ساختار نمودار دانشمندان را قادر می‌سازد تا الگوها را در داده‌ها ببینند و ناهنجاری‌ها را با دقت بیشتری تخمین بزنند.

حسگرها با یکدیگر تعامل دارند، علی و وابسته به یکدیگر هستند. بنابراین ما باید بتوانیم این اطلاعات وابستگی را به روشی که احتمالات را محاسبه می کنیم، تزریق کنیم.

این شبکه بیزی یک احتمال داده مشترک را از سری های زمانی متعدد به احتمالات کمتر پیچیده و مشروط که پارامترسازی، یادگیری و ارزیابی بسیار آسان تر است، فاکتورسازی یا تجزیه می کند. این به دانشمندان اجازه می‌دهد تا احتمال مشاهده خوانش‌های حسگر خاص را تخمین بزنند و قرائت‌هایی را که بعید به نظر می‌رسد، یعنی ناهنجاری هستند، شناسایی کنند.

روش آنها به ویژه مؤثر است زیرا این ساختار پیچیده گراف نیازی به تعریف از قبل ندارد – مدل می تواند نمودار را به تنهایی و به روشی بدون نظارت یاد بگیرد.

یک تکنیک قدرتمند

آنها این ساختار را آزمایش کردند تا ببینند چقدر می تواند ناهنجاری ها را در داده های شبکه برق، داده های ترافیک و داده های سیستم آب شناسایی کند. مجموعه داده هایی که آنها برای آزمایش استفاده کردند حاوی ناهنجاری های شناسایی شده توسط انسان بود، بنابراین دانشمندان توانستند ناهنجاری های شناسایی شده توسط مدل خود را با خطاهای واقعی در هر سیستم مقایسه کنند.

مدل آنها از همه معیارها بهتر عمل کرد و درصد بالاتری از ناهنجاری های واقعی را در هر مجموعه داده شناسایی کرد.

در مورد خطوط مبنا، بسیاری از آنها شامل ساختار نمودار نیستند. این کاملاً فرضیه ما را تأیید می کند. ایجاد رابطه وابستگی …

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

دکمه بازگشت به بالا