gabberattack napísal:Ok, precitam si to. Je nejaky jednoduchy navod kde co a ako nastavit? Chcel by som ratat Milky len na GPU a nechat CPu pre ostatne projekty. Toto vidim na dalsi zaujimavy navod pre nas novy web.
Jednoduché to není, protože BOINC na to není připraven.
Počítám na HD3870 a výkon je fajn.
Jenže - jak se dočtete v tom threadu odpověď na mojí otázku - na GPU zatím nelze počítat všechny typy WU, ale pouze některé.
Takže něci jede na CPU, něco na GPU.
BOINC obojí považuje za výpočet na CPU, ktaže se stává, že buď jede víc GPU (a stojí CPU) nebo obráceně.
Jednou z možností je v cc_config přenastavit počet dostupných CPU třeba na 8 u quadu. Je větší možnost, že se vytíží CPU i GPU (když se to správně sejde), ale zase to může zpomalovat výpočet, dkyž se to sejde nesprávně (8 WUs pro CPU na quadu). To lze dělat i na starém BOINC (5.10.30)
Novější BOINC (zkoušel jsem 6.6.3) má možnosti šachovat s avg_ncpu a max_ncpu, což je nastavení per WU (ne per BOINC, jako ncpu v cc_config). To je vhodné pro multithreaded aplikace. Jde to nastavit i na hodnoty menší než 1. Takže se dá třeba říct, že MW WU bere pouze 0.5 jádra (u ostatních projektů bere co WU to jádro). Tím pádem se třeba může pustit 2xWU PG a k tomu 4xWU na MW. Když se sejdou z MW 2CPU+2GPU, ve finále je to 4WU pro CPU a 2WU pro GPU.
Jenže to je loterie a navíc po 10-25 vteřinách, kdy je vúpočet na GPU hotov, to scheduler přehází.
BOINC prostě není pro ATI vůbec připraven (ani tak základní věc, jako detekce HW...což se teprve
možná připravuje).
Na druhou stranu
tato aplikace správně uvádí délku výpočtu (která odpovídá wall clock). Tedy i work-fetch, LTD, DCF a nárokování kreditu funguje normálně a kvůli GPU se to celé nezesere jako na jiných projektech. A tedy žádné desetitisíce kreditu za den typu GPUGrid.
ATI zde má výhodu, že je v double precision výrazně výkonější než nVidia. Nové ořezávátko typu GTX 280 je výkonově sotva na úrovni staré dobré HD3850, pokud jde o double precision výpočty.
Možná to je důvod, proč je výkon na SETI tak ubohý (že jej převálcuje optimalizace na Core i7).
Možná to je důvod, proč už není venku Einstein aplikace - protože si nechtějí udělat ostudu, že by neslavná CUDA byla pomalejší než CPU a navíc s několikanásobně vyšší spotřebou.
Tak jako tak, ATI na MW šlape velmi dobře. HD3870 mi dělá výpočet za cca 25 vteřin, HD4870 to prý dělá za 9-10 vteřin.
Snad se autorovi podaří implementovat do aplikace mechanismy, které by byly schopné počítat i ty druhé typy WU (jak jsem psal na MW foru nebo u nacionalistů).
V současnosti to šlape pouze na ATI Win x64. Teoreticky by bylo možná to zkusit na 32-bit, Linux nebo CUDA - je to o dostupných SW nástrojích a případně výkonu (CUDA a 32-bit asi nemá smysl).