» Poradna » Windows (a jiné OS)

Modrá smrt pravidelně po 6-8 hodinách provozu serveru - Windows server 2008 SP2

 |   |  Microsoft Windows 7 Firefox 52.0

Ahoj, poslední týden se mi na serveru objevuje modrá smrt v pravidelných intervalech po 6-8 hodinách provozu.Jedná se o server DELL PowerEdge T110 II, s RAID řadičem PERC H200 a Windows Server 2008 SP2 (není to R2 verze) s jedním virtuálním terminálovým serverem přes Hyper-V. Na fyzický server (řadič domény a Exchange) nemá nikdo z uživatelů přístup. Co mě zaráží, tak po BSOD nevytvoří žádný "Memory.dmp", ani zkrácený výpis v Logu ve složce "Minidump". Dal jsem samozřejmě i zakázat restart po selhání a zkontroloval nastavení stránkovacího souborů - systém si nastavuje sám. Jediné zachycené snímky mám zde:http://www.imgup.cz/images/2017/05/18/Photo17... http://www.imgup.cz/images/2017/05/18/Photo16... Koukal jsem i do logů Windows a žádné údaje o selhání (kromě manuálně vyplněného důvodu selhání). Zkusil jsem jako první vyměnit síťovou kartu pro WAN, poté zakázat i druhou síťovku pro vnitřní síť (na té jsem odpojil síťový kabel), žádná změna. Pořídil jsem 2 úplně nové disky, vytvořil nový RAID 1 a nechal provést synchronizaci pole. Na nové disky jsem provedl obnovení systému (obnova běžela cca 10 hodin bez havárie). Projel jsem i diagnostickou utilitou (po zapnutí Dellu přes F12), kde ani v operačních pamětech nenašel žádnou chybu a veškeré kontroly prošly.Nicméně po obnovení systému opět po cca 6-8 hodinách modrá smrt bez logu. Dnes jsem ještě zkoušel očesat operační paměť (jsou osazeny 4 moduly po 4GB) pokud jsem dva moduly odstranil, server běžel 9 hodin, poté smrt, zkusil jsem vyměnit další pár pamětí - tentokrát smrt po cca 4 hodinách.Jen doufám, že mi neodešly všechny 4 moduly pamětí - mají přibližně 6 let.Už mi docházejí nápady, kde problém hledat. Diskové pole se hlásí v utilitě Dellu jako plně funkční a synchronizované - ikona zelené fajfky. Co se týče vytížení serveru, paměť je zaplněna pravidelně na 80-90 procent, Ukázat celý příspěvek

Mohlo by vás také zajímat

Odpovědi na otázku

 |   |  Microsoft Windows 7 Chrome 58.0.3024.0

Aby se ti při BSOD soubory .dmp vytvářely, musíš to nejprve v nastavení zapnout.Pak soubor někam nahraj a dej sem na něj odkaz - uděláme analýzu...

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 52.0

Ono je to v nastavení zašedlé, ale zaškrtnuté. Jak budu u toho ,pošlu screen

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows 7 Firefox 45.0

Vím, že to vypadá jako nesmysl, ale zkus vyměnit klávesnici a myš.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 52.0

Neberu to jako nesmysl, můžu zkusit během provozu serveru klávesnici a myš odpojit. Já ještě zkusím tenhle návod pro ten dump soubor - vyvolat zápis do souboru přes pravý CTRL + Scroll lock + Scroll lock.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 IE 11.0

Tuhle chybu dělají ovladače. Koukněte semhttp://www.techsupportforum.com/forums/f299/solved-bsod-s... a semhttps://discussions.citrix.com/topic/275256-windows-2008... (tam je v diskusi odkaz na MS fix)

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 52.0

Zkusím tedy ještě zachytit ten dump a pak případně tohle..Nejde mi do hlavy, proč najednou po 5 letech provozu se podělají ovladače..a nepomohlo ani obnovení systému

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 IE 11.0

Protože ty ovladače se nepodělají samy, ale buď se updatnou na "aktuální" verzi, která chcípe, anebo se pod původně funkční ovladač podsune nová knihovna z update, se kterou ovladač nejede......

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Dnes jsem chvilku laboroval a narazil na další problémy. Především nedaří se mi za žádnou cenu vytvořit "memory.dmp" při modré smrti. Zkoušel jsem i jiné umístění, kam soubor vytvořit, zkusil jsem uměle vyvolat modrou smrt přes CTRL+2xScroll lock. Napíše, že byl soubor úspěšně vytvořen, ale nikde není. Nastavení dumpu a virtuální paměti posílám tady:http://imgup.cz/image/LXX7Co mě trochu zaráží, je častá chyba při stránkování:http://imgup.cz/image/LXXOKaždopádně včera v noci po cca 4 hodinách provozu opět jiné BSOD s neúspěšným zápisem dumpu:http://imgup.cz/image/LXXaPokud Vás něco napadne nebo máte tip na opravdu dobrého a ochotného specialistu na Microsoft SBS Server 2008 se znalostmi serverů Dell, dejte mi prosím vědět. Děkuji

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Zkusil jsem ten minidump nastavit - uvidím za několik hodin, jestli něco zapíše.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Pro jistotu jsem na složku minidump nastavil i "everyone" oprávnění pro úplný přístup.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Ani minidump nepomohl. Pořád prázdné

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Unknown Mozilla 0.0

Měl by jím být Ondřej Víšek (doufám, že jsem nezkomolil jméno) - specializuje se na produkty Microsoftu a migraci a pořádá i kurzy.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Chrome 58.0.3029.110

Oprava, je to tenhle „Ondřej Výšek“: http://www.optimalizovane-it.cz/o-webu.html

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Firefox 52.0

buď udělat úplně novou verzi systému nebo je potom problém v odcházející desce...

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Toho se právě bojím jako čert kříže ,ikdyž po skoro 6 letech nonstop provozu má na to nárok

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 10 Firefox 53.0

já měl podobný problém se strojem HP s Q6600. Taky jsem neustále kontroloval ramky, pak vyměnil HDD, chvíli se to tvářilo dobře, ale pak opět zamrzání, tu a tam náhodně pád. Pak to přestalo brát v posledním slotu čtvrtou ramku, takže jsem jel jen na 6GB. Nějaký čas to šlo (nějaké dva tři týdny) a pak znova problémy. Takže jsem se zbavil toho šrotu, byť taky po delší době laborování a nakonec jsem si nadával že jsem to neudělal hned když se problémy začly táhnout jak aliení sliz...

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Podle chyb (0x1A, 0x50) jde o chybu HW (První je chyba Memory managment, druhá Page fault in nonpaged area).Máš dvě možnosti, RAM nebo disk.Procesor nepočítám, tam dojde k problémům málokdy (respektive projeví se hned na začátku).Proveď kontrolu disku, pak vyházej všechny paměti a zkoušej po jedné. Ideálně si od někoho půjčit jiný modul (který je ověřený a funkční).

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Disky jsou úplně nové, na nich bylo potom provedeno obnovení systému. Raid 1 je i kompletně synchronizovaný. Paměti ještě zkouším zatím po dvojicích a na víkend nechám jen jeden 4GB modul (až nikdo nebude pracovat a mohu nechat vypnutý terminálový server přes Hyper-V)

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Firefox 53.0

Provedl jsi u nových disků diagnostiku oficiálním nástrojem od výrobce HDD ? Paměti testujte tímhle: Memtest 5.01.Vím, že zrovna u serveru, který musí bejt nonstop funkční to je nemilé, ale bez těchto 2 typů diagnostik se nikam nehneme...

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Chrome 58.0.3029.110

Memtest+ 5.01 umí úplný prd, protože je mrtvý, nepodporovaný a zastaralý a vlastně neumí ani pořádně ECC. Proto je v tomto případě zcela k ničemu.Základ je ten placený od Passmarku http://www.memtest86.com/download.htm jenže v něm, aby otestoval ECC, bude muset prolézt pochybná warezácká doupata a stáhnout nějakou ukradenou/ocrackovanou verzi. Paměti ECC by měly umět zvládnout diagnostikovat utility výrobce serveru, ovšem pokud nemá záložní server a potřebuje, aby ten stávající běžel 24/7, tak paměti bude muset zkoušet v jiném stroji. Proto jsem psal, co jsem psal: 19. 05. 2017 11:17

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Firefox 53.0

Dle webu od Dellu: http://www.dell.com/cz/domacnosti/p/poweredge... je tam osazený chipset C 202 a podporuje procesory Sandy Bridge, což je rok 2011 či 2012. Takže ten Memtest 5.01 by to měl zvládat, když jeho poslední revize je z 27. září 2013.Samozřejmě, že Memtest není všemohoucí, ale na jednoduchou diagnostiku (co mu nahlásí 4 Passy Memtestem) to stačí. Bez jednoduché diagnostiky Memtestem a diagnostiky nových HDD se dál nepohneme.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Chrome 58.0.3029.110

Nejde o to, zda podporuje nebo nepodporuje daný čipset a desku. Žádný Memtest+ NEUMÍ pořádně otestovat ECC! Pokud paměti dělají nějaké malé množství 1bit chyb, tak dojde k automatické opravě v tomhle zastaralém Memtestu+ se prostě neukážou.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Macintosh OS X Safari 10.0

Memtest používám jen na desktopech. U serveru jsem zastánce testování paměti přes utilitky Hirens, nebo Dell Diagnostic bez naběhnutého systému. Nejhorší je, že tohle mi proběhlo bez problémů u všech 4 jednotlivých modulu starých pamětí

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows 10 Firefox 53.0

U ECC pamětí je jedno, čím je testujete. Některé chyby zvládne opravit v HW, takže memtest se o nich nemůže dozvědět. To se vám Honza snaží říct. Takže nějaký Hirens vám nepomůže, potřebujete, aby ta utilitka uměla číst tyhle věci, případně se podívejte v BIOSu, IPMI, nevím, co tam máte, jestli nejsou nějaké informace v logu.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 8.1 Chrome 58.0.3029.110

V temných hlubinách internetu je ke stažení bez breberek MemTest86 v7.1.0 Pro (Pro na konci je důležité), které umožňuje konfiguraci testu přímo pro hledání ECC chyb. A pak to zobrazí údaj ECC Correctable/Uncorrectable Errors.ECC polling : Enabled/Disabled – if ECC detection/correction is supported and enabled, this option disables/enables periodic checking of any ECC errors that have been detected by the system while the memory tests are running.ECC injection: Enabled/Disabled (Pro version only) - if ECC detection/correction issupported/enabled and ECC injection is supported by the system, this optionenables/disables injection of ECC errors to simulate how the system responds to real ECC errors.Note: Although ECC injection may be supported by your hardware, it may be locked by the BIOS. Some BIOS may allow you to unlock the ECC injection feature in the BIOS setup. In some cases, however, you may need a modified BIOS which does not lock the ECC injection feature.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Unknown Mozilla 0.0

Máš možnost zkusit jiný zdroj, řadič disků a RAM? (+ původní RAM projet jinde Memtestem, který odhalí ECC chyby?)

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows Vista IE 7.0

Nesdělil jsi základní info:1) text BSOD z Admin logu;2) provozovaný bezpečnostní systém.Doplň.Diagnostika vyloučila hw závadu => hledej vadné ovladače nebo jiný nízkoúrovňový sw.Jsi si jist, že je zakázaná automatická aktualizace ovladačů (nejen) z MS WU?Btw:proč nepoložíš dotaz do příslušné odborné sekce fóra:http://forum.zive.cz/forum-1926/Windows-Server... nebo do supportu MS?

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows 8.1 Chrome 58.0.3029.110

Celkem zřejmě chyba pamětí. Pokud na serveru byla nějaká důležitá data, je dost dobře možné, že budou nečitelná kvůli silent data corruption.Proveďte memtest a zjistěte, který modul je vadný, vadné moduly zahoďte.Příště do serveru pořídit ECC paměti, které když už chybu neopraví a kvůli neopravitelné chybě spadnou, tak po sobě alespoň zanechají v logu HW managementu informaci, proč se tak stalo. Teď nevíte nic, jen to, že vám chybuje paměť, a server si tak víceméně může dělat, co se mu zachce. Tohle je moje noční můra. Proto mám všude ECC a filesystem s CRC...

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 53.0

Oni to ale jsou ECC paměti, je nějaká možnost, jak se dostat do logu přímo v paměti, když se mi nevytváří memory.dmp ani zkrácené výpisy v minidump ? Protože Windows logách nic není

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows Vista IE 7.0

Tomu nevěřím => špatně ses díval.Minimálně musí být v Systémovém logu text BSOD.Nemáš nacpaný systémový SSD na doraz?

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 52.0

Aktualizace příspěvku:Dnes jsem do serveru dal úplně novou operační paměť, server má 2 nové disky v RAID1 (nejsou to SSD), novou operační paměť, úpravou registru jsem zprovoznil aktualizace, takže se stáhlo cca 180 nových aktualizací, nechal jsem server projet "Eset File Security" - nic nenašel, tak jsem ho dal zase úspěšně pryč. ..Prozatím běží cca 4 hodiny, ale znepokojilo mě, že se po cca 4 hodinách začal instalovat "ovladač miniportu úložiště", ten mi na cca 10 minut totálně zaseknul server, kdy jsem čekal, že opět přijde modrá smrt - ale zatím nepřišla, rozdýchal to. Nejhorší je, že jsem ho ve správci zařízení nikde nenašel. Nevím, jestli to nesouvisí se spuštěním zálohováním serveru. Podařilo se mi vyfotit instalaci toho ovladače:http://imgup.cz/image/LX4I Pokud přijde další smrt, přemýšlím, že vykuchám RAID řadič (PERC H200) a nechám server běžet pouze z jednoho disku. Co se týče antiviráku, nejsem přiznivce antiviráku na serveru, na který klienti nechodí. Jen do sítě nepouštím nikoho, kdo nemá aktualizovaný antivirák na svém PC. Ale jestli má někdo odzkoušený antivirák (bez firewallu), který mi nebude server škrtit, nechám se poučit. Každopádně všem moc děkuji za reakce

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 48.0

Bude to chyba softveru.Keby to bolo v pamatiach tak by to padalo nahodne v roznych casovych rozostupoch.Rovnaky cas medzi chybami svedci ze tie sa nejakym sposobom kumuluju a potom to spadne. Plus je tu ten zisteny problem s ovladacom.Kedy si to naposledy komplet preinstaloval?Vycisti to atd. nainstaluj nanovo cely system a zakaz aktualizacie ovladacov - ak to pobezi bolo to softverom. Osekaj nepotrebne sluzby a tiez take planovane ulohy, co su nanic. Je mozne ze ti to robi nejaka novo vzniknuta planovana uloha - pozri si co tam vsteko mas a osekaj.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 48.0

Inak HP zvyklo dialkovo zablokovat neoriginalne farby v tlaciarni,Lenovo instaluje spehovaci soft,Intel blokuje novsie procaky so starymi systemami,...... najskor nejaka konspiracna firma chce, aby si si kupil cely novy system...stve ich ze ti to este bezi

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 48.0

Inak aj ja som mal problem s vytvaranim dumpu - a pritom originalny Windows atd. taklze ti co neveria ze sa to nemsui dat sparvit, tak ja sa naopak cudujem im.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 52.0

My to máme samozřejmě taky všechno originální včetně CAL i RDP licencí..Dneska mi to doma běží, zatím bez pádu už skoro 8 hodin..Ale nedokážu vyvolat takovou zátěž jako na firmě. Uvidíme zítra

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows 10 Chrome 59.0.3067.6

Běží na tom serveru nějaký antivir? Podobnou věc nám dělal před časem ESET, který shazoval server. Po odinstalaci je vše v pořádku.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 7 Firefox 52.0

Běží tam GFI Mail Essentials, pak jsem tam na chvilku šoupnul ESET File Security, ten jsem po otestování zase odstranil, jinak nic (kromě Windows Firewallu a ten má skoro všechno zakázaný)

Souhlasím  |  Nesouhlasím  |  Odpovědět

Související témata: Selhání, Aktualizace systému, Hyper-V, Fyzický server, Síťový provoz, Vnitřní síť, Diskové pole, Přetížení, Havárie, Smůla