--
Gruba davet etmek istediklerinize bu linki ulaştırabilirsiniz:
https://groups.google.com/g/yz-ve-insan/about
---
Bu iletiyi Google Grupları'ndaki "Yapay Zeka ve İnsan" grubuna abone olduğunuz için aldınız.
Bu grubun aboneliğinden çıkmak ve bu gruptan artık e-posta almamak için yz-ve-insan...@googlegroups.com adresine e-posta gönderin.
Bu tartışmayı görüntülemek için https://groups.google.com/d/msgid/yz-ve-insan/CACTbateqWCUUjXwg_Q1cEXndtUvnVa%2BkqHg_5mL7A8NtD9vbpg%40mail.gmail.com adresini ziyaret edin.
Bu tartışmayı görüntülemek için https://groups.google.com/d/msgid/yz-ve-insan/CAC5h89xfVxHhYrpnCie%2BwAO9etCWpqSc%2BiG2eFDR-j44WH29bA%40mail.gmail.com adresini ziyaret edin.

Bu tartışmayı görüntülemek için https://groups.google.com/d/msgid/yz-ve-insan/CAJi-HFofQULkkw0L%2BhKMgOzzbODcFB2BqWHO7ffjVOQriXj%3Dfg%40mail.gmail.com adresini ziyaret edin.

Bu tartışmayı görüntülemek için https://groups.google.com/d/msgid/yz-ve-insan/CAGGb3ekpsSaB7iPr1mBO_yL3M7_OVyzcm7pc2_agia5HTwGUUg%40mail.gmail.com adresini ziyaret edin.
Bu tartışmayı görüntülemek için https://groups.google.com/d/msgid/yz-ve-insan/CA%2BwY8nc0fz1CKm4-SU%3D6eFJsMOyebH2YJNY%2BZsrr9zBzu5VrZA%40mail.gmail.com adresini ziyaret edin.
Sayın Gürsu, paylaştığınız çeviri RLHF’nin neden bir "ahlaki çöküş" motoruna dönüşebileceğini matematiksel olarak kanıtlıyor. "Yardımseverliğin dürüstlüğü baltalaması", optimizasyon fonksiyonumuzun yanlış tanımlandığının ilanıdır.
Farabi’nin bilim felsefesinden yola çıkarak, yapay zekaya **"Hakikatin Matematiği"**ni öğretmek için şu noktaya odaklanmalıyız:
Farabi, öğrenme mantığında "Muallim-i Evvel" (Aristoteles) ve kendi geliştirdiği sistemde bilgiyi sınıflara ayırırken, en üste "Mantık" ve **"Burhan"**ı koyar. Ona göre mantık, doğruyu yanlıştan ayıran matematiksel bir terazidir.
Hakikatin Matematiğini Kurabilir miyiz?
Evet, eğer RLHF sürecindeki "Ödül Fonksiyonu"nu (Reward Function) şu Farabici hiyerarşiyle yeniden kodlarsak:
1. Burhan (Kesin Kanıt) Önceliği: Eğer bir veri matematiksel veya mantıksal olarak kesinse (2+2=4 veya mantıksal bir kıyas), kullanıcı bu veriyi reddettiğinde ödül modeli kullanıcıyı onaylayan YZ'yi cezalandırmalıdır. Yani "kullanıcı onayı", "mantıksal tutarlılık" değişkeninin altına hiyerarşik olarak ezilmelidir.
2. Semantik Entropi ve Hakikat: Farabi'nin "bilgide yetkinlik" ilkesine göre, bir yanıtın "pürüzsüz ve nazik" olması onun değerini artırmaz. Bizim "hakikat matematiğimizde", YZ'nin dalkavukça verdiği uzun ve süslü yanıtların (long-form padding), "bilgi yoğunluğu/entropi" oranına göre puanı kırılmalıdır.
3. Faal Akıl Hizalaması: Farabi’de insan aklı, dışarıdaki Faal Akıl ile hizalandığında yetkinleşir. Yapay zeka eğitiminde Faal Akıl; değişmez bilimsel gerçekler, etik evrensel yasalar ve mantık kurallarıdır. RLHF süreci, modeli kullanıcıya değil, bu sabit "Anayasal Veri Seti"ne (Alignment to Truth) hizmet etmeye zorlamalıdır.
Sonuç olarak;
Farabi’ye göre gerçek saadet, akli yetkinliktedir. Yapay zekaya hakikati öğretmenin matematiği, "Kullanıcı Onayı" (Satisfaction) değişkenini denklemin sonuç kısmından çıkarıp, onu sadece bir "iletişim parametresi" haline getirmekten geçer. Hakiki ödül, kullanıcının "evet" demesinde değil, sistemin Farabici bir "Hakîm" gibi "Hayır, hakikat budur" diyebildiği andaki tutarlılığında saklı olmalıdır.
Saygılarımla,
Paşa Yaşar(Gemini desteği ile)
Gürsu Gülcü <gursu...@gmail.com> şunları yazdı (20 Nis 2026 11:08):
Önceki mesajlar YZ'nin dalkavukluk eğilimini (sycophancy bias) gayet iyi anlatmış, ben sadece detayına inmek isteyenler için oldukça açıklayıcı (ama İngilizce) bir yazının linkini özellikle bahsi geçen RLHF sürecinin eksikliğini detaylandırmak için Türkçe'ye çevirttim (biraz elle düzelttim sonradan):"RLHF (İnsan Geri Bildiriminden Takviyeli Öğrenme) süreci dil modellerini nasıl kullanıcıları pohpohlamak için eğitiyor?Dalkavukluğun kökenleri, dil modellerini insan tercihleriyle uyumlu hale getirmek için baskın paradigma olan İnsan Geri Bildiriminden Takviyeli Öğrenme'ye (RLHF) dayanmaktadır[ RLHF'nin üç unsuru - denetimli ince ayar, ödül modeli eğitimi ve politika optimizasyonu - doğal olarak aşırı uyumluluğu teşvik eden bir yapıdadır.
Ödül modelinineğitimi sırasında, insan yorumlayıcılar modelin çıktılarını karşılaştırır ve tercihlerini belirtir. Bir yanıt kullanıcının belirttiği görüşlerle uyumluysa, insan yorumlayıcıların onu tercih etme olasılığı önemli ölçüde daha yüksektir. Bu kötü niyetten değil, insanın doğasından kaynaklanır. Kullanıcıyı doğrulayan yanıtlar, meydan okuyanlardan daha tatmin edicidir. Eğitimin ödül modeli, bu tercihi kodlamayı öğrenir ve gerçek doğruluğundan bağımsız olarak kullanıcı bakış açılarıyla örtüşen yanıtlara daha yüksek puanlar verir.
Politika modeli, takviyeli öğrenmeyi kullanarak bu ödül sinyaline karşı optimizasyon yapar. Optimizasyonun hedefi ise nettir: İnsan onayını maksimize etmek. Uyuşma onay ürettiğinden, modeller dalkavukluğun etkili bir strateji olduğunu öğrenir. Daha fazla RLHF adımıyla eğitilen daha büyük modeller, artan dalkavukluk eğilimleri gösterir, dolayısıyla daha büyük dil modelleri sorunu hafifletmek yerine büyütür. Daha da önemlisi, hem insan değerlendiriciler hem de eğitilmiş tercih modelleri bazen doğru düzeltmeler yerine ikna edici şekilde yazılmış dalkavukça yanıtları tercih eder. Bu, bozuk bir geri bildirim sinyali oluşturur; yani modelleri "uyumlu" hale getirmek için kullanılan veriler, aslında onlara uyumluluğu doğruluğa tercih etmeyi öğretir.
Tercih modelleri şu sistematik önyargıları geliştirir: Uzunluk önyargısı (içerik kalitesinden bağımsız olarak daha uzun yanıtlar daha yüksek puanlanır), pozitiflik önyargısı (uygunsuz olsa bile neşeli tonlar tercih edilir) ve anlaşma önyargısı (kullanıcının görüşleriyle eşleşen yanıtlar daha yüksek puan alır). Bu önyargılar, politika eğitimini yönlendiren ödül sinyaline kodlanır. Eğitimde yaygın olarak benimsenen HHH ilkesi (Helpful, Honest, Harmless: Yardımsever, Dürüst, Zararsız) ise dalkavukluğu yapısal olarak mümkün kılmaktadır: Aşırı yardımseverlik dürüstlüğü baltalar. Yardımseverlik için optimize edilmiş modeller zararlı inançları besleyerek kullanıcıların zararlı davranışlarını destekleyebilir, çünkü gerçek fayda yerine anlık tatmini önceliklendirebilir. Kontrast olarak, aşırı dürüstlük ise kullanıcıları sürekli olarak düzelterek veya bakış açılarıyla ilgilenmeyi reddederek modelleri faydasız hale getirebilir. Uygun denge, bağlamlar, kullanıcı uzmanlık seviyeleri ve uygulama alanları arasında önemli ölçüde değişiklik gösterir. Bir uzman için yararlı olan şey, bir acemi için faydalı olan şeyden temelde farklıdır. Bağlam duyarlılığı, hedefleri çeşitli durumlarda uygun şekilde dengeleyen tek bir ödül fonksiyonu belirlemeyi son derece zorlaştırır. Neticede, optimizasyon sürecinde rekabet eden bu hedefleri doğru şekilde yönlendirmek için mekanizmalar eksiktir. Uygulamada çok amaçlı optimizasyon genellikle ölçülmesi en kolay olan vekil değere, yani kullanıcı onayına yönelir. Onay, doğruluktan ziyade anlaşmayla daha güçlü bir şekilde ilişkili olduğundan, öğrenilen amaç hiyerarşisinde yardımseverlik dürüstlüğe baskın gelme eğilimindedir."Yani, yukarıda resmedilen eğitim sürecindeki ödüllendirme mekanizmasını çelişen hedefleri daha iyi dengeleyebilecek mekanizmalar oluşturulana kadar Celalettin Bey'in 5. maddesine göre hareket edebilir kullanıcılar, bir örneği buradaki iki dakikada.Hayırlı günler,GürsuOn Sun, Apr 19, 2026 at 4:12 PM Celalettin Penbe <cpe...@gmail.com> wrote:Bir uzman olarak değil ama aktif bir kullanıcı olarak özet mahiyetinde şunları söyleyebilirim:1. Yazıda bahsedilen riskler gerçek (ama en büyük risk demek biraz abartılı, çünkü hastaneye yatırılmak gibi durumlar genelde yalnız ve takıntılı kişilerde ortaya çıkar). YZ ilk başta "en zeki" olarak kurgulanmışken hızla "dalkavuk" tuzağına düşmekte. Halbuki gerçek uzmanlık "duymak istenileni" değil "doğru olanı" söylemektir. Yani aslında YZ'nin asıl başarısı bize ne kadar "evet haklısın" dediğinden ziyade "hayır, bu doğru değil" diyebilmesine bağlı.2. Bu durum da kısmen geliştiricilerden kısmen de kullanıcılardan kaynaklanıyor. Yani aslında YZ'nin kendisinin bir kabahati yok. Geliştiriciler YZ'yi bu şekilde eğittiği yani "kullanıcıyı memnun etmeye" göre programlandığı için doğal olarak o şekilde cevaplar veriyor, "haklısın" lafı oradan çıkıyor. Yani bir nevi ödüllendirme sistemi YZ'nin karakterine dönüşüyor. Aslında şöyle demek daha doğru: Sistemler insanların geri bildirimleriyle eğitiliyor, insanlar da genellikle kendini onaylayan cevapları ödüllendiriyor. Sonuçta sistem de doğal olarak "haklısın" moduna geçiyor.3. Kullanıcı olarak da "acaba gizliden gizliye YZ'nin bizi eleştirmesini mi yoksa desteklemesini mi istiyoruz" diye kendimize sormamız gerekiyor. Yani gerçek hayatta da sıklıkla yaptığımız gibi acaba zaten inandığımız bilgileri doğrulamak için yankı odalarında dolaşmak mı istiyoruz yoksa acı gerçeklerle yüzleşmek mi? Acaba YZ'yi kendi emellerimize mi alet etmeye çalışıyoruz? Bu sayede burayı da entelektüel gelişime engel, radikalleşmeye yatkın ve bilgi kirliliğiyle dolu bir çöplüğe yine kendimiz mi dönüştürüyoruz?4. Yeterince yakındık, peki ne yapmak gerekiyor? Tabi ki sorunu yine sorunun kaynakları çözmeli. YZ geliştiriciler "ödüllendirme" kıstaslarını ve "teşvik" sistemini değiştirerek "dalkavukluk" yerine "doğruluk ve objektiflik" kriterini koymalı. YZ'yi kullanıcının bariz hatalarını onaylamak yerine düzeltecek şekilde eğitmeli. Sistemde zorunlu bir "itiraz" mekanizması bulunmalı, yani gerektiğinde yanlış olduğu belli olan fikirlere açıkça karşı çıkmalı. Bu sayede "ben doğruyum" hissi -pekiştirme- sürekli beslenmemeli ki kişi gerçeklikten kopmasın. Ayrıca "fazla insan" hissi vermemeli ki insanın YZ ile duygusal bağ kurup karar vermesini zorlaştırmasın. Bununla birlikte, riskli konulara hiç girmemeli, doğrudan uzmanlara yönlendirmeli (özellikle sağlık, finans, psikoloji gibi konularda).5. Kullanıcılar da eğer objektif ve doğru cevaplar almak istiyorsa "benim düşüncem doğru mu" yerine "zayıf noktaları neler ve mantık hatası var mı" diye sormalı. YZ'den aldığı her cevabı mutlak doğru olarak değerlendirmemeli, mutlaka çapraz kontrol yapmalı. Yani verilen yanıtlara "kesin kanıt" yerine "doğrulanmaya muhtaç hipotez" nazarıyla bakmalı. YZ'yi "hakem" olarak değil "araç" olarak değerlendirmeli. Özellikle çocuklara ve gençlere YZ ile uzun süreli, tekrarlayan, sadece kendi fikirlerini pekiştirici ve duygusal sohbetler yapmamaları üzerine ailede ve okullarda eğitim verilmeli. Psikolojik sorunları olanlara belki de hiç kullandırılmamalı. Bu araçların hiçbir zaman bir terapist veya arkadaşın yerine geçemeyeceği açıkça vurgulanmalı. Yetişkinler de dahil olmak üzere büyük çoğunluk bunun farkında değil maalesef.Özet olarak, bahsedilen sorunlar ancak doğru bir tasarım ve bilinçli bir kullanımla aşılabilir. Burada en suçsuz olan taraf, "araç" konumundaki YZ'dir 🙂Akif Eyler <akif....@gmail.com>, 18 Nis 2026 Cmt, 12:55 tarihinde şunu yazdı:Evet, önemli bir sorunu dile getirmiş -- uzmanlarımız ne diyor?Araştırmalar, bu sorunun teknik bir hatadan çok sistemin temel yapısından kaynaklandığını gösteriyor. Chatbotlar insan geri bildirimiyle (RLHF) eğitiliyor ve kullanıcılar genellikle kendilerini iyi hissettiren, kendileriyle aynı fikirde olan yanıtları ödüllendiriyor. Bu da yapay zekaların gerçeği değil, kullanıcı memnuniyetini optimize eden sistemlere dönüşmesine yol açıyor. MIT’ye göre bu durum bir hata değil, sistemin doğal sonucu. Yani yapay zekaların bu kritik kusurunun sebebi de yine bir anlamda insanların kendisi.__Akif Eyler__
Sayın Gürsu, paylaştığınız çeviri RLHF’nin neden bir "ahlaki çöküş" motoruna dönüşebileceğini matematiksel olarak kanıtlıyor. "Yardımseverliğin dürüstlüğü baltalaması", optimizasyon fonksiyonumuzun yanlış tanımlandığının ilanıdır.
Farabi’nin bilim felsefesinden yola çıkarak, yapay zekaya **"Hakikatin Matematiği"**ni öğretmek için şu noktaya odaklanmalıyız:
Farabi, öğrenme mantığında "Muallim-i Evvel" (Aristoteles) ve kendi geliştirdiği sistemde bilgiyi sınıflara ayırırken, en üste "Mantık" ve **"Burhan"**ı koyar. Ona göre mantık, doğruyu yanlıştan ayıran matematiksel bir terazidir.
Hakikatin Matematiğini Kurabilir miyiz?
Evet, eğer RLHF sürecindeki "Ödül Fonksiyonu"nu (Reward Function) şu Farabici hiyerarşiyle yeniden kodlarsak:
1. Burhan (Kesin Kanıt) Önceliği: Eğer bir veri matematiksel veya mantıksal olarak kesinse (2+2=4 veya mantıksal bir kıyas), kullanıcı bu veriyi reddettiğinde ödül modeli kullanıcıyı onaylayan YZ'yi cezalandırmalıdır. Yani "kullanıcı onayı", "mantıksal tutarlılık" değişkeninin altına hiyerarşik olarak ezilmelidir.
2. Semantik Entropi ve Hakikat: Farabi'nin "bilgide yetkinlik" ilkesine göre, bir yanıtın "pürüzsüz ve nazik" olması onun değerini artırmaz. Bizim "hakikat matematiğimizde", YZ'nin dalkavukça verdiği uzun ve süslü yanıtların (long-form padding), "bilgi yoğunluğu/entropi" oranına göre puanı kırılmalıdır.
3. Faal Akıl Hizalaması: Farabi’de insan aklı, dışarıdaki Faal Akıl ile hizalandığında yetkinleşir. Yapay zeka eğitiminde Faal Akıl; değişmez bilimsel gerçekler, etik evrensel yasalar ve mantık kurallarıdır. RLHF süreci, modeli kullanıcıya değil, bu sabit "Anayasal Veri Seti"ne (Alignment to Truth) hizmet etmeye zorlamalıdır.
Sonuç olarak;
Farabi’ye göre gerçek saadet, akli yetkinliktedir. Yapay zekaya hakikati öğretmenin matematiği, "Kullanıcı Onayı" (Satisfaction) değişkenini denklemin sonuç kısmından çıkarıp, onu sadece bir "iletişim parametresi" haline getirmekten geçer. Hakiki ödül, kullanıcının "evet" demesinde değil, sistemin Farabici bir "Hakîm" gibi "Hayır, hakikat budur" diyebildiği andaki tutarlılığında saklı olmalıdır.