KUACC Hosname Değişikliği Hk.

46 views
Skip to first unread message

Onur Pulaşlı

unread,
Dec 22, 2017, 9:54:37 AM12/22/17
to slurm
Değerli HPC Kullanıcıları,

Bir önceki bilgilendirme mailinde belirtmiş olduğumuz "kuacc.ku.edu.tr" domaini websitemizle çakıştığı için "login.kuacc.ku.edu.tr" olarak değiştirilmiştir. Bu hostname ile giriş yapabilirsiniz.

Bilgilerinize sunulur,

Saygılarımızla,

Bilgi Teknolojileri Direktörlüğü

Deniz Yuret

unread,
Dec 26, 2017, 3:59:00 AM12/26/17
to Onur Pulaşlı, slurm, Erkan Tekman, ERTUGRUL DOGAN
Konfigurasyon konusunda ogrencilerimden gelen feedback'i aktariyorum:

"Interaktif job gonderemiyorum (srun ile). firewalld'ye konfigurasyon yapilmasi veya kendisinin komple kapatilmasi lazim. Hangi paket var hangi paket yok sistemlerde test edemedim job submit edemedigim icin. Preemption yok, job direk cancel ediliyor. 3 tane partition var, short, long, longer diye..."

Config konusunda eldeki calisir sistemi kurup yoneten ogrencilerimle bir toplanti yapilacakti hala yapilmadi, musait oldugunuzda lutfen haber verin.

deniz


--
You received this message because you are subscribed to the Google Groups "slurm" group.
To unsubscribe from this group and stop receiving emails from it, send an email to slurm-group...@ku.edu.tr.
To post to this group, send email to slurm...@ku.edu.tr.
To view this discussion on the web visit https://groups.google.com/a/ku.edu.tr/d/msgid/slurm-group/CAK0c34nFyq4kgNNQEasMdkFgSTqFHnSWBny1eT8L%2Br5xu5BJDw%40mail.gmail.com.

Onur Pulaşlı

unread,
Dec 26, 2017, 7:31:45 AM12/26/17
to Deniz Yuret, slurm, Erkan Tekman, ERTUGRUL DOGAN

Sayın YÜRET,

 

Sizden ve diğer öğretim görevlilerinden gelen geri bildirimleri , kurulumu ve konfigürasyonu beraber devam ettirdiğim danışman arkadaşlara ilettim. Tüm makinalarda firewall daemon’un kapalı durumda olduğunu, sorunun routing problemi olduğunu bildirdiler. Bunu statik route ile düzeltip, srun komutunun çalıştığını ilettiler. Öğrencileriniz teyit edip geri dönüş yapabilirse sevinirim.

 

Şu ana kadar Yunus ve Somon üzerindeki yükü alabilmek adına KUACC kurulumuna odaklanmış durumdaydık. Kurulum genel hatlarıyla tamamlandı, opensource/lisanslı yazılımların kurulması devam etmekte. Sonrasında uzun bir süredir kapalı durumda olan Lufer’in tekrar ayağa kaldırılıp kullanıcılara açılması için çalışmalarımızı hızlandıracağız. Attila GÜRSOY’un almış olduğu GPU’lu node’u KUACC bünyesine almak adına KUACC rack’ine fiziksel kurulumunu yaptık ve bir sonraki adımda bu işlemleri devam ettireceğiz.

 

Şu anda short,long ve longer adında 3 kuyrukla sistemimiz açıldı. İlerleyen periyotta slurm düzenlemelerini prosedürde hazırladığımız gibi şekillendirmek adına çalışmalara başlayacağız. Benim işe başladığım süreçten itibaren toplantıdan haberim yoktu. Şu anda yoğun bir şekilde kurulumlar devam ettiğinden, öğrencileriniz isteklerini ve görüşlerini bana mail yoluyla iletebilirler.

 

Saygılarımla,

 

Onur PULAŞLI

Deniz Yuret

unread,
Dec 26, 2017, 8:35:23 AM12/26/17
to Onur Pulaşlı, slurm, Erkan Tekman, ERTUGRUL DOGAN
Onur,

Ogrencilerimin istek ve goruslerini iletmek degil toplantinin amaci, yeni cluster'in konfigurasyonu konusunda sizi bilgilendirmek.  6 aydir optimize ettigimiz kullanicilarin isteklerine gore konfigurasyonunu 40 defa degistirdigimiz bir sistem var elimizde.  Bu sistemde pek cok irili ufakli problemi yasadik, cozduk, ornegin:

1. Cok sayida kucuk job atanlarla uzun job atanlar arasinda denge.
2. GPU'lu makinelerde CPU core kalmamasindan dolayi GPU kullanamama probleminin cozumu.
3. Tum arastirma gruplarinin isteklerine cevap verecek software / driver configuration.
4. Gruplarin birbirlerinin makinelerini kullanmasindaki denge.
5. Interaktif (srun), server based (jupyter), graphical (vnc) islerin run edilebilmesi.

Daha aklima gelemeyen bir suru ornek var eminim.  Bu problemleri bastan yasamamak icin bilgi paylasimi yapalim diyorum.  Neden yapmiyoruz anlamiyorum.  Belki tum bilgiler, sorunlar ve cozumler zaten elinizde ve ihtiyac yok, o da olabilir.

deniz

Reply all
Reply to author
Forward
0 new messages