Moin.
Grundsätzlich ist es bei LLR so, dass immer mehr Threads prozentual immer weniger bringen.
Sinnvoll ist die Berechnung, wie viele Aufgaben in den Cache passen, wobei hier die FFT-Größe relevant ist.
FFT x 8 ist der Bedarf im Cache.
Die FFT-Größe findest du im Stderr der jeweiligen Aufgabe (fft=xxxk).
Mit Fortschritt des jeweiligen Subprojektes vergrößert sich diese Zahl, und man muss ggfs. die eigenen Einstellungen anpassen.
Zu Hyper-Threading und LLR:
Ich rechne auf den moderneren Intels (ab Core-I 4th gen.) auch auf den Hyper-Threads, weil dies Vorteile bringt. Dies mag unter Windows anders sein; dies kann ich aber nicht sagen.
Beim Ryzen 3700X rechne ich nur auf den Cores.
Darüber hinaus kann es bei Ryzens und Intel Mehrkernsystemen wichtig sein, zu beachten, wie der Prozessor mit seinem Cache umgeht. Geteilte Cache-Bereiche sollte man auch bei den Berechnungen geteilt lassen und die Aufgaben in nur einem Bereich ansiedeln. Ausnahme: FFT-Größe zu groß, dann gerne den gesamten Cache.
Primegrid AMD Ryzen 5950X & Primegrid
- Michael H.W. Weber
- Vereinsvorstand
- Beiträge: 22000
- Registriert: 07.01.2002 01:00
- Wohnort: Marpurk
- Kontaktdaten:
Re: Primegrid AMD Ryzen 5950X & Primegrid
Ich habe jetzt auf dem Ryzen-System nochmal die RTX 3080 mit zweien statt nur einer Genefer17Low bzw. Genefer17Mega bestückt.
Dies zu tun macht keinen Sinn:
Erstens ist die Laufzeit der WU-Dublette fast genau doppelt so lange (gelegentlich mal 1-3 Sekündchen länger), wie die Einzelläufe. Es bringt also punktemässig keinen Vorteil und schmälert im Gegenteil noch die Chance auf Erstentdeckung einer neuen Zahl drastisch.
Noch viel übler aber ist, dass bei der hier im Forum vorgegebenen app_config.xml zwei CPU-Kerne freibleiben, die bei Einzel-GPU-Rechung vom Ryzen voll für zwei weitere CPU-Tasks ausgenutzt wurden.
Also lassen.
Michael.
Dies zu tun macht keinen Sinn:
Erstens ist die Laufzeit der WU-Dublette fast genau doppelt so lange (gelegentlich mal 1-3 Sekündchen länger), wie die Einzelläufe. Es bringt also punktemässig keinen Vorteil und schmälert im Gegenteil noch die Chance auf Erstentdeckung einer neuen Zahl drastisch.
Noch viel übler aber ist, dass bei der hier im Forum vorgegebenen app_config.xml zwei CPU-Kerne freibleiben, die bei Einzel-GPU-Rechung vom Ryzen voll für zwei weitere CPU-Tasks ausgenutzt wurden.
Also lassen.
Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

