14273,32%0,83
42,70% 0,02
50,12% -0,06
5959,15% 0,98
9485,02% 0,00
Büyük, ağır bir kutuyu merdivenlerden yukarı taşımak istediğinizi hayal edin. Parmaklarınızı açın ve kutuyu iki elinizle kaldırın, sonra kollarınızın üstünde tutun ve kutuyu hareket ettirmek için tüm vücudunuzu kullanarak göğsünüze doğru dengeleyin.
İnsanlar genel olarak tüm vücut manipülasyonunda iyidirler ancak robotlar bu tür görevlerde zorluk çekerler. Robot için, kutunun taşıyıcının parmakları, kolları ve gövdesi üzerindeki herhangi bir noktaya temas edebileceği her nokta, akıl yürütmesi gereken bir temas olayını temsil eder. Milyarlarca potansiyel temas olayıyla birlikte bu görevin planlanması hızla zorlu hale gelir.
Şimdi MIT araştırmacıları bu süreci basitleştirmenin, zengin temaslı manipülasyon planlaması olarak bilinen bir yolunu buldular. Basit bir algoritmanın bile robot için etkili bir manipülasyon planını hızlı bir şekilde tanımlamasını sağlamak için birçok temas olayını daha az sayıda kararla özetleyen, yumuşatma adı verilen bir yapay zekâ tekniği kullanıyorlar.
Henüz ilk günlerinde olmasına rağmen, bu yöntem potansiyel olarak fabrikaların, yalnızca parmak uçlarını kullanarak kavrayabilen büyük robotik kollar yerine, nesneleri tüm kolları veya vücutlarıyla manipüle edebilen daha küçük, mobil robotları kullanmasını sağlayabilir. Bu, enerji tüketimini azaltmaya ve maliyetleri düşürmeye yardımcı olabilir. Ayrıca bu teknik, Mars'a veya diğer güneş sistemi cisimlerine keşif görevleriyle gönderilen robotlarda, yalnızca yerleşik bir bilgisayar kullanarak çevreye hızlı bir şekilde uyum sağlayabildikleri için yararlı olabilir.
"Bunu bir kara kutu sistemi olarak düşünmek yerine, modeller kullanarak bu tür robotik sistemlerin yapısından yararlanabilirsek, bu kararları almaya çalışma prosedürünü hızlandırma ve zengin temaslı çözümler bulma fırsatı ortaya çıkar." diyor elektrik mühendisliği ve bilgisayar bilimi (EECS) yüksek lisans öğrencisi ve bu teknikle ilgili bir makalenin ortak yazarı HJ Terry Suh.
Makalede Suh'a, Boston Dynamics Yapay Zekâ Enstitüsü'nde robot bilimci olan eş başkan yazar Tao Pang PhD '23; EECS yüksek lisans öğrencisi Lujie Yang; ve kıdemli yazar Russ Tedrake, Toyota EECS, Havacılık ve Uzay Bilimleri ve Makine Mühendisliği Profesörü ve Bilgisayar Bilimi ve Yapay Zekâ Laboratuvarı (CSAIL) üyesi. Araştırma bu hafta IEEE Transactions on Robotics dergisinde yayınlandı.
Öğrenmeyi öğrenmek
Takviyeli öğrenme, bir robot gibi bir aracının, bir hedefe yaklaşmanın ödülüyle deneme yanılma yoluyla bir görevi tamamlamayı öğrendiği bir makine öğrenme tekniğidir. Araştırmacılar, bu tür öğrenmenin kara kutu yaklaşımını gerektirdiğini çünkü sistemin dünya hakkındaki her şeyi deneme yanılma yoluyla öğrenmesi gerektiğini söylüyor.
Robotun bir nesneyi belirli bir şekilde hareket ettirmenin en iyi yolunu öğrenmeye çalıştığı, temas açısından zengin manipülasyon planlaması için etkili bir şekilde kullanılmıştır.
Ancak bir robotun bir nesneyle etkileşime geçmek için parmaklarını, ellerini, kollarını ve vücudunu nasıl kullanacağını belirlerken akıl yürütmesi gereken milyarlarca potansiyel temas noktası olabileceğinden, bu deneme yanılma yaklaşımı çok fazla hesaplama gerektirir.
Suh, "Takviyeli öğrenmenin, bir politikayı gerçekten öğrenebilmek için simülasyon süresinde milyonlarca yıl geçmesi gerekebilir" diye ekliyor.
Öte yandan araştırmacılar, sistem hakkındaki bilgilerini ve robotun gerçekleştirmesini istedikleri görevi kullanarak özel olarak fizik tabanlı bir model tasarlarlarsa, bu model, bu dünyaya ilişkin onu daha verimli hale getiren yapıyı bünyesinde barındırır.
Ancak temas açısından zengin manipülasyon planlaması söz konusu olduğunda fiziğe dayalı yaklaşımlar takviyeli öğrenme kadar etkili değil.
Ayrıntılı bir analiz yaptılar ve yumuşatma olarak bilinen bir tekniğin takviyeli öğrenmenin çok iyi performans göstermesini sağladığını buldular.
Bir robotun, bir nesneyi nasıl kullanacağını belirlerken alabileceği kararların çoğu, genel şemada önemli değildir. Örneğin, bir parmağın her son derece küçük ayarı, nesneyle temasla sonuçlansın ya da sonuçlanmasın, pek önemli değil. Ortalamaların yumuşatılması, bu önemsiz, ara kararların çoğunu ortadan kaldırır ve birkaç önemli kararı bırakır.
Takviyeli öğrenme, birçok temas noktasını deneyerek ve ardından sonuçların ağırlıklı ortalamasını hesaplayarak örtülü olarak yumuşatma gerçekleştirir. Bu anlayıştan yola çıkan MIT araştırmacıları, benzer türde bir yumuşatma gerçekleştiren, temel robot-nesne etkileşimlerine odaklanılmasını ve uzun vadeli davranışları tahmin etmesini sağlayan basit bir model tasarladılar. Bu yaklaşımın karmaşık planlar oluşturmada takviyeli öğrenme kadar etkili olabileceğini gösterdiler.
Pang, "Probleminiz hakkında biraz daha fazla bilginiz varsa, daha verimli algoritmalar tasarlayabilirsiniz" diyor.
Kazandıran bir kombinasyon
Düzeltme, kararları büyük ölçüde basitleştirse de geri kalan kararları araştırmak hala zor bir sorun olabilir. Böylece araştırmacılar, modellerini, robotun alabileceği tüm olası kararları hızlı ve verimli bir şekilde arayabilen bir algoritmayla birleştirdiler.
Bu kombinasyonla, standart bir dizüstü bilgisayarda hesaplama süresi yaklaşık bir dakikaya indirildi.
Yaklaşımlarını ilk olarak robot ellere kalemi istenilen konfigürasyona getirmek, kapıyı açmak veya tabak almak gibi görevlerin verildiği simülasyonlarda test ettiler. Her durumda, modele dayalı yaklaşımları takviyeli öğrenmeyle aynı performansı elde etti, ancak çok daha kısa sürede. Modellerini donanım açısından gerçek robot kollarında test ettiklerinde de benzer sonuçlar gördüler.
"Tüm vücut manipülasyonunu mümkün kılan aynı fikirler aynı zamanda hünerli, insan benzeri ellerle planlama için de işe yarar. Daha önce çoğu araştırmacı takviyeli öğrenmenin hünerli ellere ölçeklenen tek yaklaşım olduğunu söyledi, ancak Terry ve Tao bu anahtarı alarak şunu gösterdi: Takviyeli öğrenmeden (rastgele) yumuşatma fikri, daha geleneksel planlama yöntemlerinin de son derece iyi çalışmasını sağlayabilirler," diyor Tedrake.
Ancak geliştirdikleri model, gerçek dünyanın daha basit bir yaklaşımına dayandığından nesnelerin düşmesi gibi çok dinamik hareketleri idare edemiyor. Daha yavaş manipülasyon görevleri için etkili olsa da yaklaşımları, örneğin bir robotun bir kutuyu çöp kutusuna atmasını sağlayacak bir plan oluşturamaz. Gelecekte araştırmacılar, bu son derece dinamik hareketlerin üstesinden gelebilmek için tekniklerini geliştirmeyi planlıyorlar.
Suh, "Modellerinizi dikkatli bir şekilde incelerseniz ve çözmeye çalıştığınız sorunu gerçekten anlarsanız, kesinlikle elde edebileceğiniz bazı kazanımlar vardır. Kara kutunun ötesinde şeyler yapmanın faydaları vardır" diyor.