Turkish - Measuring Intelligence — The Role of Benchmarks in Evaluating AGI

Source article: Measuring Intelligence — The Role of Benchmarks in Evaluating AGI | by SingularityNet | SingularityNET
Translation by: Faruk
Dework task link: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=9426a7ce-2862-448c-ba52-5d06a69bf81c
Community review: Please leave comments below about translation quality or like this post if it is well translated

Zekayı Ölçmek - YGZ’yi Değerlendirmede Karşılaştırmaların Rolü

Sevgili Singularitarians,

Yapay Genel Zekanın (AGI) geliştirilmesi, yapay zeka araştırmalarının nihai hedeflerinden birini temsil etmektedir. YGZ’nin kesin tanımı veya karakterizasyonu üzerinde geniş çapta mutabakata varılmamış olsa da, “Yapay Genel Zeka” teriminin birbiriyle yakından ilişkili birçok anlamı vardır ve tasarlanmış bir sistemin aşağıdakileri yapma kapasitesine atıfta bulunur:

  • insanlarla aynı kaba genel zekayı sergilerler;
  • son derece spesifik görevlere bağlı olmayan zeka sergilemek;
  • Niteliksel olarak bağlamlara genelleme de dahil olmak üzere öğrendiklerini genelleştirin
  • daha önce gördüklerinden çok farklı;
  • Geniş bir bakış açısına sahip olmalı ve mevcut görevleri mevcut bağlamda esnek bir şekilde yorumlayabilmelidir.
  • genel olarak dünya ve onunla ilişkisi.

Bu dönüm noktasına ulaşmak, yalnızca YGZ’yi geliştirmeye yönelik sağlam yöntemleri değil, aynı zamanda YGZ’nin ilerlemesini ölçebileceğimiz ve değerlendirebileceğimiz araçları da gerektirir. Dünya çapındaki araştırmacılar bu alanda sürekli ilerleme kaydettikçe, genel zekanın ortaya çıkışına yaklaştıkça kriterlerin rolü giderek daha önemli hale geliyor.

Bu makalede, bazı standartlaştırılmış testlerin bize bir makinenin gerçek, insan benzeri zekaya doğru yolculuğunun net ve objektif bir ölçümünü nasıl sağlayabileceğini inceleyerek YGZ değerlendirmesinde kriterlerin önemini keşfedeceğiz.

Her şey Turing testiyle başladı

1950 yılında Alan Turing tarafından önerilen Turing Testi, yapay zeka için en iyi bilinen kriterdir. Üç terminal içerir: biri bilgisayar tarafından, ikisi ise insanlar tarafından kontrol edilir.

Bir insan soru soran kişi olarak hareket ederken, diğer insan ve bilgisayar yanıt veriyor. Soruyu soran kişi, hangi yanıtlayıcının makine olduğunu belirlemelidir.

Bilgisayar, soruyu soran kişinin onu insandan güvenilir bir şekilde ayırt edememesi durumunda testi geçer. Başlangıçta bu test yalnızca basit evet/hayır soruları olan bilgisayarlar için geçerliydi. Ancak konuşmaya dayalı veya açıklayıcı sorgularla bu çok daha zorlayıcı hale gelir.

Robot Koleji Öğrenci Testi

2012 yılında Dr. Ben Goertzel tarafından “Robot Koleji Öğrencisi” testi önerildi. Basit bir mantığı var: Eğer bir yapay zeka, insanlarla aynı şekilde diploma alabiliyorsa, o zaman bilinçli olduğu düşünülmelidir. Bu test, bir yapay zekanın akademik ortamda bilgiyi öğrenme, uyarlama ve uygulama yeteneğini değerlendirir.

Dr. Ben Goertzel’in ünlü “Turing testi”ne makul bir alternatif oluşturan fikri, birçok Ais’in başarısı olmasaydı bir düşünce deneyi olarak kalabilirdi. Bunlardan en önemlisi, OpenAI araştırma laboratuvarı tarafından oluşturulan dil modeli olan GPT-3’tür. Ancak insansı bir yapay zeka robotu olan Bina48, 2017 yılında Notre Dame de Namur Üniversitesi’nde bir üniversite dersini tamamlayan ilk kişi oldu. Bir başka örnek ise Çin’de bir matematik sınavının iki versiyonunu tamamlayan robot AI-MATHS’dir. Her ne kadar üniversite derslerini ve sınavlarını tamamlayabilseler de, bu yapay zekaların duyarlılığa ve gerçek genel zekaya ulaşmak için hâlâ kat etmesi gereken uzun bir yol var.

Kahve Testi

Yine Dr. Ben Goertzel tarafından önerilen ve Apple’ın kurucu ortağı Steve Wozniak tarafından desteklenen Kahve Testi, ev ortamında kahve yapan bir yapay zeka uygulamasını içeriyor. Yapay zeka herhangi bir mutfaktaki malzemeleri ve ekipmanı bulmalı ve kahve yapma gibi basit bir görevi yerine getirmelidir. Bu test, yapay zekanın yeni bir ortamı anlama ve yönlendirme, nesneleri tanıma ve karmaşık bir eylem dizisini yürütme yeteneğini değerlendirerek pratik zekasını yansıtıyor.

Farklı yapay zeka kıyaslamalarını değerlendirmek için kullanılan diğer standartlaştırılmış testler

Bir yapay zekanın AGI olma yolunda olup olmadığını değerlendirmek, insan zekasına benzer çok yönlülük, genelleme ve uyarlanabilirlik göstermesi gerektiğinden, mümkün olan en geniş bilişsel görev yelpazesindeki yeteneklerinin değerlendirilmesini içerir.

Sıklıkla dikkate alınan bazı önemli kriterler ve kriterler şunlardır:

· Öğrenme ve Uyum

· Sağduyulu Muhakeme

· Yaratıcılık ve Yenilik

· Problem Çözmede Çok Yönlülük

· Doğal Dil Anlama (ve Üretme)

· Algı ve Etkileşim

· Genelleme

· Etik ve Ahlaki Muhakeme

Bu kriterleri değerlendirmek için standartlaştırılmış testlerin, gerçek dünyadaki zorlukların ve birden fazla alanda sürekli değerlendirmenin bir kombinasyonu esastır.

Önerilen mevcut değerlendirme çerçevelerinden bazıları şunlardır:

· AI2 Muhakeme Yarışması (ARC), bir yapay zekanın sağduyulu akıl yürütme yeteneklerini değerlendirmek üzere tasarlanmış, Allen Yapay Zeka Enstitüsü (AI2) tarafından oluşturulan bir kıyaslama veri kümesidir. Bir yapay zekanın cevaplaması gereken iki soru seti vardır; biri kolay, yüzeysel sorulardan oluşur, diğeri ise doğru cevabı bulmak için karmaşık akıl yürütme ve birden fazla bilgi kaynağının entegrasyonunu gerektiren bir dizi sorudan oluşur. Ana hedefi, bir makinenin anlayabileceği ve akıl yürütebileceği şeylerin sınırlarını zorlamaktır.

· Genel Dil Anlama Değerlendirmesi (GLUE) testi, çeşitli doğal dil anlama (NLU) görevlerinden oluşan bir koleksiyondur. Duygu analizi (örneğin, belirli bir duygu bir metin parçasında ifade ediliyor mu?), metinsel gerektirme (bir cümlenin diğerinden mantıksal olarak takip edilip edilmediğinin belirlenmesi) ve hatta anlambilim gibi farklı görev gruplarından oluşması ilginçtir. benzerlik (örneğin, iki farklı cümle anlam açısından ne kadar benzer?) GLUE, insan dilini anlayabilen ve üretebilen yapay zeka sistemlerinin geliştirilmesindeki ilerlemeyi değerlendirmek ve teşvik etmek için tasarlanmıştır.

· Winograd Şema Yarışması, yapay zekanın bağlamı anlama ve doğal dildeki belirsizlikleri çözme yeteneğini değerlendirmek için tasarlanmış, özellikle zamir belirsizliğini gidermeye odaklanan bir testtir. Yapay zeka sistemlerinin dil ve bağlam hakkındaki daha derin anlayışını test etmeyi amaçlıyor; bu, gerçek dünya bilgisini ve akıl yürütmeyi içerecek şekilde yalnızca istatistiksel model tanımanın ötesine geçen bir şeydir. Eğer bir yapay zeka Winograd Şema Yarışmasında “başarılı” ise, bu onun bağlamsal olarak uygun yargılarda bulunabildiği ve dolayısıyla dil konusunda daha insani bir anlayış sergilediği anlamına gelir.

Etkili bir YGZ kıyaslamasını nasıl oluştururuz?

YGZ için etkili kıyaslamalar oluşturmak karmaşık, zorlayıcı ve çok yönlü bir sorundur.

Ve ilk olarak zekanın ne olduğunun tanımlanmasıyla başlar; akıl yürütme, problem çözme, öğrenme, algılama ve duygusal anlama gibi çok çeşitli bilişsel yeteneklerin hesaba katılmasını içerir, bu da kapsamlı kıyaslamaların oluşturulmasını çok zorlaştırır.

AGI’nin basit aritmetikten karmaşık karar verme ve yaratıcı düşünmeye kadar çeşitli görevlerde başarılı olması bekleniyor ve doğal olarak bu, bu kadar geniş bir yetenek yelpazesini değerlendirmek için kıyaslamaların tasarlanmasını daha da karmaşık hale getiriyor.

İnsan zekası deneyim ve öğrenmeyle birlikte geliştiğinden, YGZ kıyaslamalarının hem statik performansı hem de zaman içinde uyum sağlama yeteneğini değerlendirerek bu dinamik doğayı hesaba katması gerekir.

Bütün bunlarla birlikte, bize bu ilerlemeyi ölçmek için standartlaştırılmış, nesnel bir araç sağlayacakları için kıyaslamaların YGZ’ye yönelik gelişimi ve ilerlemeyi değerlendirmede büyük bir rol oynadığını söylemek yanlış olmaz.

Ancak, işin büyüklüğü ve karmaşıklığı nedeniyle etkili bir kıyaslama oluşturuluncaya kadar kat etmemiz gereken hâlâ uzun bir yol var. YGZ araştırmaları ilerledikçe, kıyaslamalarımızın karmaşıklığı ve kapsamlılığı da artacak ve bizi gerçek yapay genel zeka hedefine daha da yaklaştıracaktır.

SingularityNET Hakkında

SingularityNET, merkezi olmayan, demokratik, kapsayıcı ve faydalı bir Yapay Genel Zeka (AGI) yaratma misyonuyla Dr. Ben Goertzel tarafından kurulan Yapay Zeka (AI) hizmetlerine yönelik merkezi olmayan bir Platform ve Pazaryeri’dir.

  • Herkesin yapay zeka algoritmaları, modelleri ve verileri geliştirebileceği, paylaşabileceği ve bunlardan para kazanabileceği Platformumuz .
  • Birinci sınıf nöral-sembolik AGI Çerçevemiz OpenCog Hyperon , bir sonraki yapay zeka inovasyonu dalgası için temel bir hizmet olacak.
  • Ekosistemimiz , endüstrilerde devrim yaratmak için pazar sektörlerinde gelişmiş yapay zeka çözümleri geliştiriyor.

En Son Haberlerden Haberdar Olun, Bizi Takip Edin: