Einsten@Home GPU-Tasks: System Freezing

Astronomie (Einstein, Universe@Home, Milkyway@home, ...)
Nachricht
Autor
oleander
Vereinsmitglied
Vereinsmitglied
Beiträge: 30
Registriert: 10.08.2014 19:41

Einsten@Home GPU-Tasks: System Freezing

#1 Ungelesener Beitrag von oleander » 06.03.2016 17:49

Hej,

wir testen gerade im Hackspace, wie sehr sich Boinc im Hintergrund hält, wenn eine Maschine gleichzeitig für andere, serverartige Aufgaben eingesetzt werden soll.
Da dort eine vergleichsweise große GeForce GTX 465 (driver version 361.28, CUDA version 8.0, compute capability 2.0, 1023MB, 981MB available, 855 GFLOPS peak) verbaut ist, die sowieso nie genutzt wird, lassen wir diese ebenfalls 24/7 laufen.

Gestern ist die Maschine dann gestorben. Die Statistiken zeigen kurz, wie der Load (avg. 1 min) auf 20 geht, dann friert die Maschine ein. Der Stromverbrauch ist dabei von ~280W auf ~190W "eingebrochen". Boinc zeigt in den Logs, dass in diesem Moment der Task p2030.20151021.G186.60-00.92.S.b3s0g0.00000_1888_1 gestartet wurde. Auf dem System lief zum Zeitpunkt des Crashes Kernel 4.4.1-2-ARCH.
Die Aufgabe läuft seit eben wieder. Bisher ohne Crash und bei normaler Load.

Sind solche Instabilitäten hier im Forum aktuell bekannt? Bei Einstein@Home direkt finde ich nur sehr alte Berichte.

ChristianB
Vereinsvorstand
Vereinsvorstand
Beiträge: 1915
Registriert: 23.02.2010 22:12

Re: Einsten@Home GPU-Tasks: System Freezing

#2 Ungelesener Beitrag von ChristianB » 06.03.2016 20:30

Dem stderr.txt log entnehme ich das die App um 17:30:06 gestartet wurde aber nicht sehr weit kam und um 17:34:17 neu gestartet ist. Beim ersten Versuch kann aber noch keine Berechnung stattgefunden haben. Dafür fehlen noch ein paar Zeilen. Kann natürlich sein das die noch im Buffer waren und das System die nicht mehr geschrieben hat. Leider gibt es hier keine Tagesangabe aber ich nehme mal an das zwischen 17:30 und 17:34 24h liegen und das System um fast die gleiche Zeit neugestartet wurde nachdem es 24h vorher sich aufgehangen hat.

Ich weiss nicht genau was die App am Anfang zwischen den fehlenden Logzeilen macht aber grundsätzlich eigentlich nur prüfen ob alle Dateien da sind und die Kartendaten abfragen. Da erfolgt noch keine Berechnung die eventuell den Kernel abschmieren lässt. Gibt es denn im kernellog zu dem Zeitpunkt etwas interessantes?

Bei Einstein@home ist mir auch nichts bekannt das sich solche Sachen in letzter Zeit häufen. Es gibt eigentlich nur Probleme mit Treibern unter Windows.

oleander
Vereinsmitglied
Vereinsmitglied
Beiträge: 30
Registriert: 10.08.2014 19:41

Re: Einsten@Home GPU-Tasks: System Freezing

#3 Ungelesener Beitrag von oleander » 07.03.2016 23:18

Leider liegt sonst gar nichts vor, da das System ziemlich unmittelbar eingefroren ist. Zwischen den Berechnungen liegen etwa 24h, ja. Der Versuch mit der PID 5281 ist der, der erfolgreich lief. Der Crash war mit PID 3921.
Ansonsten Danke für Deine Auskunft. Mal schauen, ob sich das noch mal bemerkbar macht.

OT: Kennst Du vielleicht noch andere Projekte mit GPU-Tasks, die stabil unter Linux mit CUDA / OpenCL auf NVIDIA laufen? GPUGRID produzierte auf der Maschine bisher nur Fehler. Poem@Home gefällt mir derzeit sehr gut.

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20889
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Einsten@Home GPU-Tasks: System Freezing

#4 Ungelesener Beitrag von Michael H.W. Weber » 08.03.2016 11:49

oleander hat geschrieben:OT: Kennst Du vielleicht noch andere Projekte mit GPU-Tasks, die stabil unter Linux mit CUDA / OpenCL auf NVIDIA laufen? GPUGRID produzierte auf der Maschine bisher nur Fehler. Poem@Home gefällt mir derzeit sehr gut.
Milkyway@home und PrimeGrid laufen unter Ubuntu 14.04 LTS mit proprietären NVIDIA/CUDA-Treibern fehlerfrei. Milkyway bislang immer, PrimeGrid kann bei einigen Kärtchen mal stehen bleiben - merkst Du aber nach wenigen Minuten.

Alternativ kann ich Dir noch das nicht-BOINC-Projekt Folding@home empfehlen. Das wird Dir vermutlich besonders gefallen - rechne dort bitte für Team 3, wenn möglich.

Michael.

P.S: GPUGrid läuft bei mir auf keiner der inzwischen 5 getesteten Ubuntu 14.04 LTS-Maschinen, trotz sauberer NVIDIA/CUDA-Treiberinstallation.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Antworten

Zurück zu „Astronomie“