Secciones
Referencias
Resumen
Servicios
Descargas
HTML
ePub
PDF
Buscar
Fuente


Stochastinės valdymo sistemos kokybės vertinimasimitacinio modeliavimo metodu
Quality estimation of stochastic control system using simulation methods
Lietuvos matematikos rinkinys, vol. 61 Ser. B, pp. 29-37, 2020
Vilniaus Universitetas

Articles


Recepción: 30 Diciembre 2020

Aprobación: 15 Marzo 2021

DOI: https://doi.org/10.15388/LMR.2020.22718

Summary: Tiriama stochastinio valdymo sistema. Straipsnyje sprendžiama žmogaus ir roboto humanoido bendravimo problema. Problema iškyla kuriant žmogaus elgesio forma- vimo valdymo sistemas. Jose žmogaus elgesys aprašomas tikimybinėmis charakteristikomis. Tokios valdymo sistemos yra stochastinės. Aprašoma žmogaus elgesio formavimo valdymo sistema ir jos funkcionavimo kokybės vertinimas. Problema sprendžiama imitacinio mode- liavimo metodu. Aprašoma metodą įgyvendinanti programinė įranga. Pateikiami eksperi- mentinių tyrimų rezultatai.

Keywords: Robotai, robotai humanoidai, valdymas, imitacinis modeliavimas, sąsaja.

Abstract: The stochastic control system is investigated. Verbal human and humanoid robot interaction prob- lem is being investigated. The behavior of the management entity is described by probabilistic characteristics. The characteristics, properties of the controller’s elements of artificial intelligence, the length of the system feedback memory are evaluated.

The problem is solved by simulation modeling. The stochastic control system is shown. The simulation modeling method used is described. The system implementing the method and its software are described. The results of simulation modeling are presented.

Keywords: Robots, humanoid robots, control, simulation modeling, interaction.

1 Įvadas

Ateina žmonių ir robotų humanoidų bendravimo laikai. Žmonėms talkins robotai, robotai humanoidai – kruopštūs, kantrūs, klusnūs, nepavargstantys, nestreikuojantys, tiksliai dirbantys, greitai dirbantys darbuotojai.

Robotai jau dabar naudojami įvairiose srityse [1, 4, 2, 5, 6, 8, 7, 3, 9]. Plinta robotai humanoidai [4, 2, 6, 8, 7]. Robotai humanoidai pradedami naudoti spren- džiant sveikatos priežiūros klausimus [8]. Aktyviai naudojami pramogų industrijoje [6]. Pasitelkiami robotai ir mokymo reikmėms [4, 3].

Robotai gali padėti ugdyti žmonių gebėjimus. Tai įgyvendinti galima sistemose, kuriose žmogus sąveikauja verbaliniu būdu su dirbtinio intelekto robotu humanoidu. Nagrinėsime kaip imituojant roboto humanoido mokymo sistemą galime spręstiugdymo problemą.


1 pav
Žmogaus ir roboto humanoido valdymo sistemos koncepcija. V – žmogus. R – robotas.

2 Problema

Spręsime žmogaus gebėjimų ugdymo valdymo sistemos kokybės vertinimo problemą. Sistemos elementai yra žmogus ir robotas humanoidas su dirbtiniu intelektu, kurių savybės aprašomos tikimybinėmis charakteristikomis. Sistemos elementai sąveikauja šnekėdami lietuviškai. Žmogus mokomas racionaliai įgyvendinti užduotis – perkelti objektą Q , esantį taške A , per aplinką S , į tašką B , sunaudojant kuo mažiau pastangų, laiko ar/ir materialinių sąnaudų, resursų. Reikia pateikti sistemos valdymo teoriją, algoritmus, techninę ir programinę įrangą, leidžiančią vertinti žmogaus gebėjimų ug- dymo sistemos kokybę.

3 Valdymo sistema

Nagrinėsime žmogus – robotas humanoidas valdymo sistemą, kurios koncepcija yra pateikta 1-me paveikslėlyje, o veikimo schema yra pateikta 2-me paveikslėlyje. Juose u yra užduotis, kurią žmogus turi išmokti racionaliai spręsti. V valdomasis žmogus, mokomas racionaliai spręsti užduotis u . Žmogaus elgesys x i , sprendžiant užduotis u , aprašomas tikimybinėmis charakteristikomis KN i ( i = 1 , . . . ,K ) , kur K bandymų skaičius, N žmogaus atsakymas. Žmogus V , gavęs užduotį u gali priimti sprendimus:

  1. x T i , teisingus su tikimybe p T i , i = 1 , . . . ,K ;

  2. x Z i , neteisingus su tikimybe p Z i , i = 1 , . . . ,K ;

  3. x N i , sakyti nežinau su tikimybe p N i , i = 1 , . . . ,K ;

R valdantysis robotas humanoidas su dirbtiniu intelektu I i , duodantis žmogui patarimus žodžiu y i , i = 1 , . . . ,K . Žmogaus ir roboto sąveikos pavyzdys yra pavaizduotas 3 pav.

Sąveika tarp elementų V ir R palaikoma verbaliniu būdu šnekant lietuvių kalba, panaudojant šnekos atpažintuvą A ir šnekėtuvą S .


2 pav
Žmogaus ir roboto humanoido valdymo sistemos koncepcija. V – žmogus. R – robotas humanoidas. A – lietuvių kalbos atpažintuvas. S – lietuvių kalbos sintezatorius. I – roboto intelektas. u – užduotis, kurią racionaliai vykdyti turi išmokti žmogus. xi – žmogaus sakomas sprendimas lietuvių kalba. yi – roboto patarimas sakomas lietuviškai žodžiu.


3 pav
Žmogaus ir roboto humanoido valdymo sistemos principinė schema su baigtinio, K ilgio, atminties grįžtamuoju ryšiu.


4 pav
Stochastinės valdymo sistemos elementai.

4 Sąveikos valdymas

Sąveiką valdo sistema su baigtinio, K ilgio, grįžtamuoju ryšiu. Atliekant tyrimus ir darant eksperimentus, buvo naudojamas lietuviškai bendraujantis robotas humanoidas Ąžuolas NAO. Gebėjimų ugdymo tobulinimo valdymo stochastinės sistemos elementai yra parodyti 4 pav.

Robotas humanoidas, bendraudamas, šnekėdamas su žmogumi – vaiku, moko vaiką, ugdo jo gebėjimus, kaip ir kokius sprendimus jis turėtų daryti kai reikia objektą Q , esantį būsenoje A , per aplinką S , perkelti į būseną B , sunaudojant kuo mažiau pastangų, laiko, materialinių sanaudų ar resursų.

Sąveikos valdymas ir jos imitacinis modeliavimas vyksta ciklais. Kai kurių ciklų skaičius K = 4 , galimi sprendimų variantai yra parodyti 5 pav.

Pirmas ciklas, K = 1

1T. Žmogus, sužinojęs iš roboto R 0 , kad jo priimtas sprendimas x T 0 buvo teisingas, reiškia užduotis u yra įvykdyta, gauna iš roboto R 0 padėką už teisingą sprendimą. Ugdymas baigtas.

1Z. Žmogus, sužinojęs iš roboto R 0 , kad jo sprendimas buvo xZ0, gali priimti sprendimus:

  1. x Z 1 su tikimybe p Z 1 , arba

  2. x ZN 1 su tikimybe p N 1 .

1N. Žmogus, sužinojęs iš roboto, kad jo sprendimas buvo x N 0 gali priimti sprendimus:

  1. – x x ZN 1 su tikimybe p Z 1 , arba

  2. x NN 1 su tikimybe p N 1 .

K ciklas


5 pav
Sprendimų priėmimų schema kai ciklų skaičius K = 4.

Kai ciklų skaičius K = 4 , galimi sprendimų variantai parodyti aukščiau 5 pav.

KT. Žmogus, sužinojęs iš roboto R K 1 , kad jo priimtas sprendimas x T k 1 buvo tesingas, reiškia užduotis u yra įvykdyta, gauna iš roboto R K padėką už teisingą sprendimą. Ugdymas baigtas.

KZ. Žmogus, sužinojęs, kad jo priimtas sprendimas buvo x Z K-1 gali priimti sprendimus:

  1. x Z K su tikimybe p Z K , arba

  2. x N K su tikimybe p N K .

KN. Žmogus, sužinojęs, kad jo priimtas sprendimas yra x NK 1 gali priimti sprendimus:

  1. x Z K su tikimybe p Z K , arba

  2. x N K su tikimybe p N K .

5 Programinė įranga

Žmogaus ir roboto humanoido valdymo schema yra parodyta 6 pav.

Žmogaus ir roboto sąveikos K=4 ciklų valdymo schemos programinė įranga pavaizduota 7 pav.

6 Eksperimentiniai tyrimai

Žmogaus ir roboto humanoido su dirbtiniu intelektu bendravimo valdymo sistemos, kurios elementai sąveikauja lietuvių šneka, programinė įranga buvo parašyta naudojant Matlab programinės įrangos paketą.

Matlab programinėje įrangoje buvo parašytas Matlab skriptas, kuris atlieka imitacijos bandymus. Šis skriptas yra parašytas specifine Matlab kalba, užima 18 kilobaitų ir yra 449 eilučių ilgio. Imitacijų rezultatai yra gaunami keičiant kintamuosius kurie aprašo bandymų skaičių ir teisingų, neteisingų irnežinauatsakymų tikimybes. Ap-rašius visus parametrus ir Matlab programinėje įrangoje paspaudus kodo vykdymomygtuką – gaunami imitacinio modeliavimo rezultatai.


6 pav
Žmogaus – roboto valdymo sistema.


7 pav
Žmogaus ir roboto sąveikos, K = 4 ciklų, valdymo sistemos programinė įranga.

1 lentelė.
Priimamų sprendimų tikimybės pirmam žmogui.

2 lentelė.
Priimamų sprendimų tikimybės antram žmogui.

Atliekant imitacinio modeliavimo bandymus, buvo imituojamos dvi situacijos: vienu atveju tikimybės, kad bus pasakyti teisingi atsakymai yra mažos, kurios yra pavaizduotos 1 lentelėje ir antruoju atveju tikimybės, kad bus gauti teisingi atsakymai yra didesnės už pirmąją situaciją ir jos pavaizduotos 2 lentelėje. Eksperimentas buvo daromas imituojant 100 000 bandymų. Nustačius pradines sąlygas pirmai situacijai, pavaizduotas 1-ojoje lentelėje apačioje, pirmosios situacijos gaunami rezultatai yra matomi žemiau 8 pav.

Nustačius pradines sąlygas antrai situacijai, pavaizduotas 2-ojoje lentelėje apačioje, antrosios situacijos rezultatai yra matomi žemiau 9 pav.

8 ir 9 pav. pavaizduotas santykinis dažnis kairėje −K -tojo ciklo tikimybė, kad bus pasakytas tam tikras atsakymas. Didėjant ciklų skaičiui – teisingų atsakymų tikimybė auga – žmogus pasakys teisingą atsakymą 1, 2 arba K-tojo ciklo metu, o neteisingų arba nežinau atsakymų vis mažės, kadangi vis dažniau bus pasakomas teisingas atsakymas iš antro, trečio ar ketvirto karto.

Žiūrint į 8 pav. galima pastebėti, kad modeliuojama situacija kai teisingų atsakymų tikimybė yra maža, tikimybė kad paskutinio bandymo metu vis dėl to bus pasakytas teisingas atsakymas yra maža. Tokia situacija rodytų, kad roboto mokomasis turinys yra blogas ir 4-ojo bandymo metu – 69,798% žmonių atsakytų į duotą uždavinį teisingai.

Žiūrint į 9 pav. galima pastebėti, kad modeliuojama situacija kai teisingų atsakymų tikimybė yra didelė, jau antrojo bandymo metu matoma, kad tikimybė kad bus gautas teisingas atsakymas yra aukšta. Tokia situacija rodytų, kad roboto mokomasis turinys yra veiksmingas ir 4-ojo bandymo metu dauguma žmonių atsakytų į duotą uždavinį teisingai – 99,719%.

7 Išvados

  • Eksperimentiniai tyrimai patvirtino galimybes patogiai eksperimentuoti vertinant žmogaus ir roboto humanoido su dirbtiniu intelektu bendravimo valdymo sistemos kokybę.

  • Sukurta žmogaus ir roboto humanoido su dirbtiniu intelektu bendravimo valdymo sistema, kurios elementai sąveikauja lietuvių šneka.


8 pav
1-ojo žmogaus, kurio savybės pateiktos 1 lentelėje, imitacinio modeliavimo rezultatai.


9 pav
2-ojo žmogaus, kurio savybės pateiktos 2 lentelėje, imitacinio modeliavimo rezultatai.

  • Pateiktas žmogaus ir roboto humanoido bendravimo valdymo sistemos kokybės vertinimo metodas, įgyvendinamas imitacinio modeliavimo priemonėmis.

  • Parodyta, kad imitacinis modeliavimas leidžia vertinti stochastinės valdymo sistemos kokybę.

Literatūra

[1] K. Anter et al. Do it NAO 6 – Creative Project Ideas. 2019.

[2] C. Bartneck, T. Belpaeme, F. Eyssel, T. Kanda, M. Keijsers, S. Šabanović. Human–Robot Interaction: An Introduction. 2020.

[3] A. Bhat, A. Chojnacki, E. Knapp. The future is nao: teaching mathematics to young schoolchildren using humanoid robhots. In New Friends 2016 2nd International Confe- rence on Social Robots in Therapy and Education, 2016.

[4] A. Choudhury, H. Li, Ch. Greene, S. Perumalla. Humanoid Robot-Application and Inf- luence. 2018.

[5] H. Ishiguro et al. Active Participation in Lectures via a Collaboratively Controlled Robot. 2020.

[6] T. Kanda, D. Morimoto, J. Even. Can a robot handle customers with unreasonable complaints. In HRI ’20: Proceedings of the 2020 ACM/IEEE International Conference on Human-Robot Interaction, 2020.

[7] Y. Oishi, T. Kanda, M. Kanbara, S. Satake, N. Hagita. Toward end-user programming for robots in stores. In Proceedings of the Companion of the 2017 ACM/IEEE International Conference on Human-Robot Interaction, pp. 233–234, 2017.

[8] Y. Okafuji, J. Baba, J. Nakanishi, I. Kuramoto. Can a humanoid robot continue to draw attention in an office environment? Advanced Robotics, 34(2):1–16, 2020. https://doi.org/10.1080/01691864.2020.1769724.

[9] Y. Okafuji, J. Baba, J. Nakanishi, I. Kuramoto, H. Ishiguro K. Ogawa, Y. Yoshikawa. Can a humanoid robot continue to draw attention in an office environment? Advanced Robotics, 34(2):1–16, 2020.



Buscar:
Ir a la Página
IR
Visor de artículos científicos generados a partir de XML-JATS4R por