Error while computing

Alles zum Projekt RNA World
Nachricht
Autor
Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Error while computing

#1 Ungelesener Beitrag von Stimpy » 27.01.2016 22:26

Hallo, wollte nochmal nachhaken, weil die letzte WU beim Neustart meines Rechners abgebrochen ist:
es geht um
http://www.rnaworld.de/rnaworld/result. ... d=14950078
Habe gut 800 Stunden an dieser WU gerechnet und auf einmal gabs nen Abbruch wegen Fehler bei der Berechnung. Das ist jetzt 3 Monate her. Ich habe gehofft, dass zumindest ein Teil der WU verwertbar ist. Werden diese noch geprüft? Waren 800 Stunden umsonst? Woran könnte es gelegen haben, da mein PC eigendlich immer stabil läuft (leichte Übertaktung, keine exotische Software)!

Gruß
Michael
Bild

ChristianB
Vereinsvorstand
Vereinsvorstand
Beiträge: 1915
Registriert: 23.02.2010 22:12

Re: Error while computing

#2 Ungelesener Beitrag von ChristianB » 28.01.2016 00:35

Laut dem Logfile war nicht genug RAM zur Verfügung in dem Moment wo welcher gebraucht wurde (passiert halt). Daraufhin hat VBox die VM abgebrochen. Die 800h sind leider verloren da es keine Zwischenergebnisse gibt.

Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Re: Error while computing

#3 Ungelesener Beitrag von Stimpy » 28.01.2016 09:12

Ah ok, das ist plausibel. Hatte letzten Herbst erst von 8 auf 16Gb aufgerüstet, leider zu spät. Zusätzlich lief glaub ich auch Atlas. Dann weiß ich zumindest, worauf ich nächstes mal achten muss. Im Moment ist alles auf Rosetta gestellt wegen der Challenge, ich hoffe danach gibt es wieder RNA-WUs.
Danke für die Analyse! :wave:
Bild

Kurzer
Idle-Sammler
Idle-Sammler
Beiträge: 3
Registriert: 19.02.2016 18:22

Re: Error while computing

#4 Ungelesener Beitrag von Kurzer » 19.02.2016 18:43

@Stimpy

Du kannst dich trösten mit deinen 800 Stunden. Meine WU ist nach knapp 2300 Stunden zerbröselt. :evil: In meiner "Boinc-Zeit" sind mir schon ein paar WUs kaputt gegangen auch von RNA. Das hat mich immer geärgert, da ja keine Ergebnisse abgeliefert wurden. Also habe ich es nochmal versucht. Was soll ich sagen, RNA ist für mich sowas von gestorben, das kannst du dir nicht vorstellen :x .

Gruß Kurzer

Jacob Klein
Oberfalter
Oberfalter
Beiträge: 492
Registriert: 26.07.2013 15:41

Re: Error while computing

#5 Ungelesener Beitrag von Jacob Klein » 20.02.2016 23:20

BOINC gets better, with each new version of the RNA World "cmsearch VM (VirtualBox) 1.0.2" application and each new version of BOINC.

800 hours (~33 days)? 2300 hours (~96 days)? I'm sorry for your losses.

I have 7 RNA World "monster" tasks, in progress, and their statuses are:
134 d -- 2/20/2016 -- UI 69.102%, progress.txt 0.635431
33 d -- 2/20/2016 -- UI 41.708%, progress.txt 0.98765
64 d -- 2/20/2016 -- UI 73.343%, progress.txt 0.98765
130 d -- 2/20/2016 -- UI 46.921%, progress.txt 0.816924
205 d -- 2/20/2016 -- UI 58.196%, progress.txt 0.542633
182 d -- 2/20/2016 -- UI 91.823%, progress.txt 0.98765
172 d -- 2/20/2016 -- UI 65.530%, progress.txt 0.919677

I'm very happy that one reached 200+ days!
However, based on the completion time of the wingman, and my estimated calculations based on "Measured FLOPS" and PassMark benchmarks, for the computers
... the estimated completion times for two of those tasks, on my slow computers, is: 448 days and 495 days!

Fun! Hang in there!

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20599
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Error while computing

#6 Ungelesener Beitrag von Michael H.W. Weber » 21.02.2016 10:22

Und noch etwas: Auch ich als Projektbetreiber habe noch zwei WUs am Laufen, die eine davon hat gerade heute die 5000 Std. Marke überschritten, die zweite ist kurz davor.
Und ja, auch ich habe erhebliche Verluste hinnehmen müssen und das macht keinen Spass. Aber nur durch Hartnäckigkeit und Fehlerberichte haben wir auch etliche Probleme korrigieren können. Ich denke zudem, unsere VM lief schon immer stabiler als die der anderen DC-Projekte.

Und letztlich ist es jedem selbst überlassen, ob er das Laufenlassen der großen WUs in seinen RNA World Einstellungen erlaubt oder nicht.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Kolossus
TuX-omane
TuX-omane
Beiträge: 2511
Registriert: 26.10.2014 14:51
Wohnort: Köln
Kontaktdaten:

Re: Error while computing

#7 Ungelesener Beitrag von Kolossus » 21.02.2016 18:49

Kurzer hat geschrieben:@Stimpy

Du kannst dich trösten mit deinen 800 Stunden. Meine WU ist nach knapp 2300 Stunden zerbröselt. :evil: In meiner "Boinc-Zeit" sind mir schon ein paar WUs kaputt gegangen auch von RNA. Das hat mich immer geärgert, da ja keine Ergebnisse abgeliefert wurden. Also habe ich es nochmal versucht. Was soll ich sagen, RNA ist für mich sowas von gestorben, das kannst du dir nicht vorstellen :x .

Gruß Kurzer
Oweia, da wäre ich auch durch die Decke gegangen! 2300 Std für die Katz? Heftig! Da hätte ich auch keine Lust mehr. Wieso sind die Wus überhaupt so irre groß? Normal ist etwas anderes....
Gruß Harald

Ich habe geweint, weil ich keine Schuhe hatte, bis ich einen traf, der keine Füße hatte. Giacomo Leopardi

Bild

Kurzer
Idle-Sammler
Idle-Sammler
Beiträge: 3
Registriert: 19.02.2016 18:22

Re: Error while computing

#8 Ungelesener Beitrag von Kurzer » 12.03.2016 12:40

Die 2300 Std. sind nur die Anzeige der WU selber. Gerechnet hat sie auf meinen Rechner aber 7298 Std oder insgesamt 304 Tage ( :wave: Jacob Klein, da musst noch ein bisschen rechnen).
Da wäre es optimal wenn die WU wenigstens alle 2 Wochen ein Zwischen-ergebniss übermitteln würde. Dann bräuchte man die WU bei einen Fehler nicht noch mal komplett rechnen oder?

Gruß Kurzer

Jacob Klein
Oberfalter
Oberfalter
Beiträge: 492
Registriert: 26.07.2013 15:41

Re: Error while computing

#9 Ungelesener Beitrag von Jacob Klein » 12.03.2016 13:29

These tasks work in a VirtualBox VM. Snapshots (checkpoints) are taken every 30 minutes. The client sends a trickle message "I'm still working on it" every couple of hours, to the server, and the server extends the deadline "OK, deadline extended, but let me know again within the next 2 weeks!"

Are you proposing that it upload the VM data every 2 weeks? My research indicates that the VM size is about 1.5 GB uncompressed, and 900 MB compressed. That would be a lot of data to upload to the server, every 2 weeks.

I don't know how to prevent the lost work, if the task fails. The only thing I can recommend is: Take VERY special care when working on these huge tasks, and get them done as quick as you can!

Here are some specific recommendations from me:
- Do not run any other VirtualBox BOINC projects, while running an RNA World task
- If your CPU has hyperthreading enabled, and you have an RNA World task, set "Use at most x% of the CPUs" to 50%, so the CPU won't place 2 threads onto a core that runs an RNA World task
- Create a stable system, where you don't need to restart the PC very often, and don't need to install software often. When updating the OS or installing software, close BOINC first!
- Ignore all progress values and all estimate values. Only try to estimate a VM's remaining time, by comparing to a wingman that has completed the task before you. See here for details: viewtopic.php?f=75&t=16160
- Have loads of patience!

:) Good luck!

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20599
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Error while computing

#10 Ungelesener Beitrag von Michael H.W. Weber » 12.03.2016 14:20

Jacob Klein hat geschrieben:Here are some specific recommendations from me:
- Do not run any other VirtualBox BOINC projects, while running an RNA World task
Du kannst seelenruhig auch andere Virtualbox Projekte mit RNA World kombinieren. Ich habe beispielsweise seit > 1 Jahr RNA World parallel mit ATLAS@home UND vLHC@home auf derselben Maschine am Rödeln - absturzfrei.
Man muss bloss aufpassen, dass man die Zahl der jeweils zu startenden WUs korrekt einstellt, sodass einem der Arbeitsspeicher nicht überläuft und man sollte darauf achten, das Snapshotintervall grosszügig zu setzen.
Ich lasse auf solchen Systemem nur alle Stunde den Plattenzugriff zu.
Das gilt bei mir übrigens generell auch für SSD-Systeme, wo man sich das "Dauerschreibseln" ohnehin absparen sollte.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Jacob Klein
Oberfalter
Oberfalter
Beiträge: 492
Registriert: 26.07.2013 15:41

Re: Error while computing

#11 Ungelesener Beitrag von Jacob Klein » 12.03.2016 15:16

Hi Michael,

Sure, you may run other VirtualBox BOINC projects, while running an RNA World task. Sorry for the confusion.

BUT...
It's a risk, because I've seen a crash with VBoxManage crash/error multiple tasks at the exact same time, and I presume that it is still possible if a catastrophic error happens, even if the VBoxWrapper is now using COM API for communication. All VirtualBox communication is still passing through the single main VBoxSvc.exe VirtualBox Interface.

Basically, I believe that running other VirtualBox BOINC projects is not worth the risk, in my opinion, which is why I do not recommend it.

Kurzer
Idle-Sammler
Idle-Sammler
Beiträge: 3
Registriert: 19.02.2016 18:22

Re: Error while computing

#12 Ungelesener Beitrag von Kurzer » 11.04.2016 17:04

Danke für die Credits trotz kaputter WU.

Gruß Kurzer

Antworten

Zurück zu „RNA World Diskussionen (deutsch)“