Ziekenhuis legt ICT-netwerk plat na storing
Het Universitair Medisch Centrum Groningen (UMCG) heeft vanaf vrijdagmiddag het hele ict-netwerk platgelegd om te kunnen onderzoeken waarom de infrastructuur instabiel is. Woensdag 3 maart 2010 ontstond een hardwareprobleem dat enkele belangrijke medische en administratieve systemen instabiel maakte. Dat vertelt een woordvoerster van de instelling. De belangrijkste processen lopen voorlopig handmatig, waardoor patiënten geen last ondervinden.
'De afgelopen anderhalve dag was mondjesmaat verbetering zichtbaar. Het leek erop dat alles een beetje stabieler werd', aldus de woordvoerster. Omdat hiermee het probleem niet was opgelost, is besloten het hele netwerk plat te leggen.
De voorlichtster weet niet welke hardware de storing veroorzaakte, maar wel welke systemen erdoor getroffen zijn. Het gaat om uiteenlopende systemen die het ziekenhuis gebruikt, zoals voor de automatische verwerking van röntgenfoto's en ct-scans en de koppeling daarvan aan de patiëntgegevens, het elektronisch patiëntendossier en het facturatiesysteem. Ook de systemen voor elektronische recepten en voor laboratoriumaanvragen zijn door de storing getroffen.
Handmatig
Als tijdelijke oplossing heeft het UMCG besloten om de belangrijkste processen handmatig en/of op papier te verwerken. Zo worden de röntgenfoto's tijdelijk niet op het beeldscherm maar aan de lichtbak bekeken. De voorlichtster vreest dat dit veel werk oplevert zodra de systemen weer draaien: 'Alles wat nu handmatig wordt gedaan, moeten we uiteindelijk in de systemen inkloppen.'
De woordvoerster vertelt dat bijna alle ict'ers van het ziekenhuis zijn ingeschakeld om de oorzaak van de storing te achterhalen, de systemen te herstellen en in de gaten te houden. Ze schat dat het er zo'n honderd tot honderdvijftig zijn. Er zijn 24 uur per dag ict'ers aan het werk.
http://hbr.org/product/when-hackers-turn-to-blackmail-hbr-case-study/an/R0910X-PDF-ENG
Het ziekenhuis laat inderdaad zien dat ze ook met pen en papier de zaak nog draaiende kunnen houden. Voor de belangrijkste processen is dit inderdaad zeer belangrijk; daarvoor dan ook alle lof.
Maar als je allerlei röntgen, CT en MRI scans af moet gaan zeggen omdat je, door een ICT storing, je gegevens niet op kunt slaan en verwerken, dan wordt het toch vrij lastig je zaak draaiende te houden.
Ik kan mij je "dubbele gevoel" wel voorstellen. Terugvallen op een lager niveau van ICT ondersteuning gebeurt ook niet voor de lol, maar heeft ten doel om datgene wat nog wel aan zorg te leveren is, enigszins georganiseerd te doen. Dan is er van de situatie -vervelend als die is- in elk geval het beste te maken. Of een MRI scan dan onmogelijk wordt weet ik niet (kan die niet los van een netwerk opereren?) maar er is ook nog heel veel [zelfs levensreddende] zorg mogelijk en vereist, zelfs zonder netwerk en imaging instrumenten.
MRI scans etc. kunnen wel zelfstandig uitgevoerd worden, maar de gegevens kunnen alleen lokaal bekeken worden.
Daarnaast zal de opslag van de scanner vol lopen als de gegevens niet doorgestuurd kunnen worden naar een centraal opslagsysteem.
Maar waar ik eigenlijk op doel is de commerciele kant van het ziekenhuis. Als je een aantal (niet levensbedreigende) ingrepen \ diagnoses niet uit kunt voeren doordat het netwerk niet beschikbaar is, dan kan dit een aardige aanslag zijn op de inkomsten.
Als het hardware is moet het toch met een nieuw apparaat op te lossen zijn ?
Of maakt men gebruik van virtualisatie, wat ineens een SPOF blijkt te zijn voor meerdere systemen tegelijk ?
Bijv. VMware ESX 4.0 met Update1, zonder de updates die daarna kwamen ? (>> disconnected storage veroorzaakt instabiel netwerk)
Inderdaad. Ik vermoed ook dat er op architectuurvlak weleens wat hiaten zouden kunnen bestaan. De kern van een netwerk in een bedrijfskritische omgeving dient hoe dan ook HA (soms zelfs triple-HA) te worden uitgevoerd.
Tegenwoordig is het erg eenvoudig (en ook gebruikelijk) om die redundantie door te trekken naar distri- en access lagen, welke steeds vaker geintegreerd zijn. Als daar het probleem niet zit kan ook nog gedacht worden aan onvoldoende inzicht in de verkeersstromen. Zijn de afhankelijkheden tussen onderliggende systemen goed in kaart gebracht? Zo ja, tot op welk niveau?
Ik begin als de spreekwoordelijke stuurman te klinken, maar een ding weet ik wel zeker: als je met zoveel mensen al zolang aan het troubleshooten bent, dan is er sprake van *en* een expertiseprobleem *en* een "ontwerpfoutje".
Is het raden daarvan wellicht TE voor de hand liggend ?
Dan ben ik wel erg benieuwd wat het probleem nu was..
Waar ik me het meeste over verbaas en zorgen maak is dat men in 5 dagen van 24 uur met 100 tot 150 mensen geen oorzaak kan vinden."
Heb je die artikelen van de vtsPN laatst niet gelezen, dat is veel erger, en gevaarlijker:
minimaal 250 man, 24 uur per dag, minimaal 45 dagen lang.
Nu moet nog van alles alsnog ingevoerd en ingescand worden.
In een ziekenhuis moeten systemen (zowel servers als netwerk-componenten) in een "hot-standby" manier werken, dwz: automatic-switch-over. Als dat niet het geval was moet de It-manager op staande voet ontslagen worden... 5 dagen? Dat is hier toch geen joke of zo???
De bottleneck bleek een centrale switch.
Netwerk switch?


Dit zou in veel organisaties gewoon eens preventief geoefend moeten worden.