Využití neuronových sítí k predikci a nalezení anomálií

publikováno: 18. prosince 2020

Odstranění outliers v signálu, červené křížky značí outliers

Využití umělé inteligence je v současné době na vzestupu v mnoha oborech, její využití v energetice se jeví neméně perspektivně. V energetice se algoritmy umělé inteligence využívají zejména k včasné detekci anomálií a k tzv. outliers, tedy k vytvoření modelů stárnutí komponent a zařízení pro využitím v prediktivní údržbě, ale rovněž k predikci budoucích jevů, která pomáhá efektivně regulovat systémy s velkým dopravním zpožděním, jako jsou například kotle. V tomto článku ukážeme dvě případové studie. První studie popisuje, jak lze využít modely pro detekci outliers, druhá studie se zabývá predikcí potřebného tepelného výkonu pro efektivní regulaci stroje.

Úvod

Prediktivní diagnostika je efektivní nástroj pro provozovatele energetických strojů. Dostupnost informací o aktuálním stavu, stárnutí a budoucím chování zařízení napomáhá plánovat pochůzky, údržbu a výměnu komponent. Vstupem pro prediktivní diagnostiku jsou data ze senzorů umístěných v rámci stávající diagnostiky. Kontinuálním měřením vzniká značné množství dat, které lze využít pro trénink modelů založených na neuronových sítích. Následná odchylka naměřených dat od hodnot, které očekává neuronový model na základě předchozího tréninku, obvykle poukazuje na fyzickou změnu některé komponenty sledovaného zařízení. Tímto způsobem lze detekovat a v případě použití komplexnějších modelů (závisí na množství dostupných dat) i lokalizovat stárnutí konkrétních součástí, spolehlivě odhadovat čerpání životnosti a předpovědět vznik poruchy. Prediktivní diagnostika a sledování stárnutí energetických strojů je hlavní motivací provozovatelů a to z pohledu minimalizace provozních rizik (neplánovaných odstávek) a maximalizace zisku.

Anomaly detektor

Včasné zachycení nestandardního chování částí zařízení bylo hlavní motivací k vytvoření neuronového modelu pro detekci výchylek v měření. Tímto modelem je totiž možné včas upozornit provozovatele zařízení o anomáliích v jakémkoli měření v reálném čase.

Pro správné fungování a natrénování sítě je mít zapotřebí velké množství dat, nejlépe z kontinuálního měření. Předpokládejme, že dostatek dat z měření máme. V naší studii byly použity dvě různé neuronové sítě: síť typu NARX (obr. 3) (nonlinear autoregressive network with exogenous inputs) a LSTM (long short-term memory network, obr. 4). Jako vstup do sítě byl v rámci studie použit výkon turbíny a jako výstup teplota na jednom z ložisek turbíny. Síť se tak naučí závislost mezi těmito dvěma jevy. V první řadě je zapotřebí rozdělit data na trénovací a data, která použijeme pro nalezení outliers. Data byla rozdělena v poměru 3:1, tedy prvních 75 % časového signálu bylo zvoleno jako trénovací a zbylých 25 % pro nalezení outliers.

Pro určování detekce výrazných odchylek byla nejdřív síť naučena na datech, které byly zbaveny všech odchylek. Tím bylo zajištěno, že když se reálně objeví nějaká extrémní výchylka v měření, odhad neuronové sítě se bude značně lišit, jelikož pro tyto výchylky nebyla natrénována. Tímto způsobem pak detekujeme zmíněné outliers. Pro odstranění odchylek pro trénovací data je zapotřebí nejdříve odstranit trend. To bylo dosaženo odečtením klouzavého mediánu. Po tomto odečtení jsou určeny výrazné odchylky kritériem 5-sigma, což znamená, že všechny hodnoty ve větší vzdálenosti než je pětinásobek směrodatné odchylky, jsou považovány za outliers (obr. 2).

Obě zvolené rekurentní neuronové sítě se používají pro predikci časových řad. Vstupy a výstupy jsou pro obě časové řady stejné. Tyto dva typy neuronových sítí se liší především v procesu trénování. LSTM síť je navíc součástí hlubokého učení a je přímo navržena pro učení se dlouhodobých závislostí v časových řadách. Naším cílem bylo porovnání těchto dvou přístupu a zjištění, která síť je vhodnější pro detekci outliers.

Na obr. 5, resp. obr. 6 lze vidět výsledky z NARX, resp. LSTM sítě. Horní obrázek vykresluje predikovanou hodnotu teploty a skutečně změřenou teplotu. Dolní obrázek pak zobrazuje velikost chyby odhadu, což není nic jiného než rozdíl predikované teploty pomocí neuronové sítě a skutečně naměřené hodnoty. Velikost této chyby je klíčová pro detekci outliers. Z obrázků lze vidět, že obě sítě vcelku přesvědčivě dokážou rozpoznat velké extrémní hodnoty vyskytující se v časové řadě. Lze si tedy určit nějakou mezní chybu, při jejíž překročení by systém upozornil provozovatele o nestandardních hodnotách z měření.

Prediktivní model

Druhou fází vývoje životnostních modelů je vývoj predikčních modelů. Predikční modely vycházejí ze struktury LSTM, kde daný model se defacto naučí stavovou reprezentaci sledovaného systému a na základě vstupních dat je schopen predikovat následné chování. LSTM model navíc obsahuje informace o historii systému (jakousi krátkodobou paměť), díky níž tento typ modelu dobře vystihuje i složitou dynamiku některých systémů. Důležitým faktorem při tvorbě predikčních modelů je správné definování vstupních a výstupních parametrů a dostatečné množství dat k trénování. Trénovací data by měla být co nejrozmanitější, aby se trénovaný systém měl možnost naučit všechny alternativy.

Následující příklad využití predikčního modelu ukazuje, jak je možné natrénovat LSTM síť, aby predikovala tepelný výkon, který bude zapotřebí za 2 hodiny. Tedy jaké teplo bude zapotřebí dodat do vytápěné lokality.

Vstupem této sítě byly parametry venkovní teploty, rychlost větru, vlhkosti, denní hodina, den v týdnu a skutečně změřený aktuální odběr tepla. Výsledky predikce je možné odečíst z obr. 7, kde červená křivka je aktuální stav, modrá čárkovaná křivka je predikce v následujících 2 hodinách a zeleně jsou vyznačeny intervaly spolehlivosti daného odhadu.

Závěr

Podařilo se vytvořit anomaly detektory založené jednak na statistických přístupech, ale také pokročilé detektory založené na NARX a LSTM sítích a porovnat je mezi sebou. Pokročilé anomaly detektory byly nasazeny na hlídání teplot ložisek.

Dále byl vytvořen prediktivní model pro předpověď odebíraného tepelného výkonu. Tento model lze s lehkými úpravami nasadit na systémy s velkým dopravním zpožděním, kdy je zapotřebí včas začít regulovat daný systém a tím omezit podregulování nebo přeregulování dané soustavy.

Zdeněk Kubín a Karel Liška
Výzkumný a zkušební ústav Plzeň s.r.o.

Literatura
[1] Jia, F., Lei, Y., Lin, J., Zhou, X., Lu, N. (2016): Deep neural networks: A promising tool for fault characteristic mining and intelligent diagnosis of rotating machinery with massive data. Mechanical Systems and Signal Processing, Vol. 72, pp. 303-315. ISSN 0888-3270
[2] Hochreiter, S., Schmidhuber, J. (1997): Long short-term memory. Neural Computation, Vol. 9, pp. 1735-1780. ISSN 0899-7667
[3] The Matworks (2020): MATLAB, SIMULINK. The Mathworks, [online]. Available at: https://uk.mathworks.com/