Agentes Inteligentes Key Note 2007

download Agentes Inteligentes Key Note 2007

If you can't read please download the document

description

Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda de sensores y actuar en ese medio utilizando actuadores.

Transcript of Agentes Inteligentes Key Note 2007

  • 1. Intelligent AgentsAgentes Inteligentes Universidad Tcnica Particular de LojaAdvanced Technology Computing GroupNelson Piedra, Janneth Chicaiza, Mara Beln MoraC ATCG.UTPL bnla www.utpl.edu.ec Computer Science School - Intelligence Artifitial Fundamentals 2007 Course 1

2. Agentes y su entorno2 3. entornoAgentes y su entornoactuadores sensores? Un agente es cualquier cosaagentecapaz de percibir supercepciones acciones medioambiente con la ayudade sensores y actuar en ese medio utilizando actuadores. figura 1, agentes y su entorno3 4. analoga...rganosmiembros sensoriales para actuar ojos, odos,AGENTE manos, piel, nariz, HUMANO piernas, bocasinestesiafigura 1, agentes y su entornoentradas componentes sensorialespara actuar presentacin tecleo, les, AGENTEmonitor, envopaquetes ROBOT paquetesvisitar:http://es.wikipedia.org/wiki/Sentidohttp://es.wikipedia.org/wiki/Sinestesia4 5. hiptesis general: un agente puede percibir sus propias acciones, pero no siempre sus efectos5 6. Un agente tomar una decisin en unmomento dado dependiendo de la secuencia completa de percepciones hasta ese instante f (percepciones(acciones)) = comportamiento EntornoAcciones ComportamientoFuncin de percepciones6 7. f de caracterizacin externa comportamientopercepcin a percepcin b percepcin c percepcin naccin a XXXaccin bXXaccin c XXaccin nXX 7 8. Funcin y Programa de un Agente 8 9. Funcin y Programa de un Agente La funcin de un agente es una descripcin matemtica abstracta. 8 10. Funcin y Programa de un Agente La funcin de un agente es una descripcin matemtica abstracta. El programa el agente es una implementacin completa, que se ejecuta sobre la arquitectura del agente. 8 11. AB Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse ala izquierda, derecha,aspirar la suciedad ono hacer nada figura 3, tabla parcial para el mundo de la aspiradora 9 12. AB Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse a[A, limpio]Derechala izquierda, derecha,aspirar la suciedad ono hacer nada figura 3, tabla parcial para el mundo de la aspiradora 9 13. AB Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse a[A, limpio]Derechala izquierda, derecha,aspirar la suciedad o[A, sucio] Aspirarno hacer nada figura 3, tabla parcial para el mundo de la aspiradora 9 14. AB Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse a[A, limpio]Derechala izquierda, derecha,aspirar la suciedad o[A, sucio] Aspirarno hacer nada[B, limpio]Izquierda figura 3, tabla parcial para el mundo de la aspiradora 9 15. AB Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse a[A, limpio]Derechala izquierda, derecha,aspirar la suciedad o[A, sucio] Aspirarno hacer nada[B, limpio]Izquierda[B, sucio] Aspirar figura 3, tabla parcial para el mundo de la aspiradora 9 16. A B Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse a [A, limpio] Derechala izquierda, derecha,aspirar la suciedad o [A, sucio]Aspirarno hacer nada [B, limpio] Izquierda [B, sucio]Aspirar [A, limpio], [A, limpio]Derecha figura 3, tabla parcial para el mundo de la aspiradora 9 17. A B Aspiradora percibe el cuadrante en el queest y si hay o nosuciedad. figura 2, el mundo de la aspiradoraElige entre moverse a [A, limpio] Derechala izquierda, derecha,aspirar la suciedad o [A, sucio]Aspirarno hacer nada [B, limpio] Izquierda [B, sucio]Aspirar [A, limpio], [A, limpio]Derecha [A, limpio], [A, sucio] Aspirar figura 3, tabla parcial para el mundo de la aspiradora 9 18. A BAspiradora percibe elcuadrante en el que est y si hay o no suciedad. figura 2, el mundo de la aspiradora Elige entre moverse a [A, limpio] Derecha la izquierda, derecha, aspirar la suciedad o[A, sucio] Aspirar no hacer nada [B, limpio] Izquierda[B, sucio] Aspirar [A, limpio], [A, limpio]Derecha [A, limpio], [A, sucio] Aspirar [A, limpio], [A, limpio], [A, limpio] Derecha figura 3, tabla parcial para el mundo de la aspiradora9 19. ABAspiradora percibe elcuadrante en el que est y si hay o no suciedad. figura 2, el mundo de la aspiradora Elige entre moverse a[A, limpio]Derecha la izquierda, derecha, aspirar la suciedad o[A, sucio] Aspirar no hacer nada[B, limpio]Izquierda[B, sucio] Aspirar [A, limpio], [A, limpio]Derecha[A, limpio], [A, sucio]Aspirar [A, limpio], [A, limpio], [A, limpio] Derecha[A, limpio], [A, limpio], [A, sucio] Aspirar figura 3, tabla parcial para el mundo de la aspiradora9 20. Qu hace que un agente sea bueno o malo, inteligente o estpido? 10 21. Buen comportamiento: el concepto de racionalidad11 22. Un agente racional es aquel quehace lo correcto. 12 23. Un agente racional es aquel quehace lo correcto. Qu es hacer los correcto?:12 24. Un agente racional es aquel quehace lo correcto.Qu es hacer los correcto?: Es obtener el mejor resultado; por tanto es necesario medir el grado de xito 12 25. Un agente racional es aquel quehace lo correcto.Qu es hacer los correcto?: Es obtener el mejor resultado; por tanto es necesario medir el grado de xito Las medidas de rendimiento incluyen los criterios que determinan el xito en el comportamiento del agente. 12 26. Hay que contar con medidas de rendimiento objetivas.Se puede preguntar al agente por suopinin subjetiva acerca de su propia actuacin, pero muchos agentes seran incapaces de contestar, y otros podran engaarse a s mismos. La seleccin de medidas derendimiento no es siempre fcil.13 27. Qu es mejor, una vida temeraria con altos y bajos, o una existencia segura peroaburrida? 14 28. Qu es mejor, una economa enla que todo el mundo es pobre o una en la que unos son pobres y otros ricos?15 29. Cul es la mejor forma de limpiar una casa: lento perobien, o rpido y mediocre?16 30. Racionalidad, depende de: 17 31. Racionalidad, depende de: Medida deRendimiento que dene criteriode xito17 32. Racionalidad, depende de: Medida deRendimiento que dene criteriode xitoConocimientodel medioacumulado por elagente17 33. Racionalidad, depende de: Medida deRendimiento que dene criteriode xitoConocimientodel medioacumulado por elagente Secuenciade Percepcionesdel agente hasta esemoment 17 34. Racionalidad, depende de: Medida deRendimiento que dene criteriode xitoConocimientodel medioacumulado por elAcciones queagente puede ejecutarel agenteSecuenciade Percepcionesdel agente hasta esemoment 17 35. Agente racional, denicin18 36. Agente racional, denicin En cada posible secuencia de percepciones, un agente racional deber emprender aquella accin que supuestamente maximice su medida de rendimiento, basndose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente mantiene.18 37. Se puede considerar agente racional el usado en el problema de la aspiradora?19 38. 20 39. Depende!! para que lo sea, se han de denir la medida de rendimiento, caractersticas del entorno, determinar lossensores y actuadores del agente20 40. 21 41. La medida de rendimiento premia con un punto al agente por cada recuadro limpio en un periodo de tiempo concreto, a lo largo de una ciclo de 1000 periodos21 42. La medida de rendimiento premia con un punto al agente por cada recuadro limpio en un periodo de tiempo concreto, a lo largo de una ciclo de 1000 periodos La geografa del medio se conoce a priori, pero la distribucin de la suciedad y localizacin inicial del agente no se conocen. Las cuadrculas se mantienen limpias y aspirando se limpia la cuadrcula en que se encuentre el agente. 21 43. La medida de rendimiento premia con un punto al agente por cada recuadro limpio en un periodo de tiempo concreto, a lo largo de una ciclo de 1000 periodos La geografa del medio se conoce a priori, pero la distribucin de la suciedad y localizacin inicial del agente no se conocen. Las cuadrculas se mantienen limpias y aspirando se limpia la cuadrcula en que se encuentre el agente. Las acciones Izquierda y Derecha mueven al agente hacia la izquierda y derecha excepto en el caso de que ello pueda llevar al agente fuera del recinto, en este caso el agente permanece donde se encuentra. 21 44. La medida de rendimiento premia con un punto al agente por cada recuadro limpio en un periodo de tiempo concreto, a lo largo de una ciclo de 1000 periodos La geografa del medio se conoce a priori, pero la distribucin de la suciedad y localizacin inicial del agente no se conocen. Las cuadrculas se mantienen limpias y aspirando se limpia la cuadrcula en que se encuentre el agente. Las acciones Izquierda y Derecha mueven al agente hacia la izquierda y derecha excepto en el caso de que ello pueda llevar al agente fuera del recinto, en este caso el agente permanece donde se encuentra. Las nicas acciones permitidas son Izquierda, Derecha, Aspirar y NoOperar21 45. La medida de rendimiento premia con un punto al agente por cada recuadro limpio en un periodo de tiempo concreto, a lo largo de una ciclo de 1000 periodos La geografa del medio se conoce a priori, pero la distribucin de la suciedad y localizacin inicial del agente no se conocen. Las cuadrculas se mantienen limpias y aspirando se limpia la cuadrcula en que se encuentre el agente. Las acciones Izquierda y Derecha mueven al agente hacia la izquierda y derecha excepto en el caso de que ello pueda llevar al agente fuera del recinto, en este caso el agente permanece donde se encuentra. Las nicas acciones permitidas son Izquierda, Derecha, Aspirar y NoOperar El agente percibe correctamente su localizacin y si esta localizacin contiene suciedad21 46. Ominisciencia, aprendizaje y autonoma 22 47. Ominisciencia, aprendizaje y autonoma Racionalidad versus Omnisciencia22 48. Ominisciencia, aprendizaje y autonoma Racionalidad versus Omnisciencia Un agente omnisciente conoce el resultado de su accin y acta de acuerdo con l. 22 49. Ominisciencia, aprendizaje y autonoma Racionalidad versus Omnisciencia Un agente omnisciente conoce el resultado de su accin y acta de acuerdo con l. Segn la denicin propuesta, la racionalidad no requiere omnisciencia, ya que la eleccin racional depende slo de la secuencia de percepcin hasta la fecha.22 50. Ominisciencia, aprendizaje y autonoma Racionalidad versus Omnisciencia Un agente omnisciente conoce el resultado de su accin y acta de acuerdo con l. Segn la denicin propuesta, la racionalidad no requiere omnisciencia, ya que la eleccin racional depende slo de la secuencia de percepcin hasta la fecha. En realidad, la omnisciencia no es posible 22 51. un poco de cultura... 23 52. un poco de cultura... La discusin de la predestinacin implica generalmente la consideracin de si Dios es omnisciente, o eterno o atemporal (fuera del ujo del tiempo en nuestro universo). En trminos de estas ideas, Dios puede VER el pasado, el presente y el futuro, para que Dios sepa efectivamente el futuro. 23 53. un poco de cultura... La discusin de la predestinacin implica generalmente la consideracin de si Dios es omnisciente, o eterno o atemporal (fuera del ujo del tiempo en nuestro universo). En trminos de estas ideas, Dios puede VER el pasado, el presente y el futuro, para que Dios sepa efectivamente el futuro. Si Dios en algn sentido SABE tempranamente lo que suceder, entonces los acontecimientos en el universo se predeterminan efectivamente del punto de vista de Dios. Esto en s mismo no es predestinacin (aunque implique el determinismo). La predestinacin implica que Dios ha determinado el avance de lo que ser el destino de las criaturas, no que est simplemente enterado. 23 54. un poco de cultura... La discusin de la predestinacin implica generalmente la consideracin de si Dios es omnisciente, o eterno o atemporal (fuera del ujo del tiempo en nuestro universo). En trminos de estas ideas, Dios puede VER el pasado, el presente y el futuro, para que Dios sepa efectivamente el futuro. Si Dios en algn sentido SABE tempranamente lo que suceder, entonces los acontecimientos en el universo se predeterminan efectivamente del punto de vista de Dios. Esto en s mismo no es predestinacin (aunque implique el determinismo). La predestinacin implica que Dios ha determinado el avance de lo que ser el destino de las criaturas, no que est simplemente enterado.http://es.wikipedia.org/wiki/Predestinaci%C3%B3n 23 55. 24 56. Racionalidad NO es lo mismo que perfeccin.Racionalidad maximiza el rendimiento esperado, mientrasla perfeccin maximiza el resultado ideal/real.24 57. 25 58. La perfeccin en agentes escostosa e imposible a estasalturas del partido.Preferir lo imperfecto posible alo perfecto imposible.25 59. 26 60. La denicin propuesta de racionalidad norequiere omnsciencia, ya que la eleccin racional depende slo de la secuencia de perfeccin hasta la fecha.Es necesario asegurarse de no haber permitido, por descuido, que el agente sededique decididamente a llevar a caboacciones poco inteligentes. 26 61. Partes importantes de la racionalidad Cmo llevar a caboacciones con laintencin de modicar percepciones futuras? 27 62. Partes importantes de la racionalidadCmo llevar a cabo Recopilacin deInformacin acciones con la intencin de modicarpercepciones futuras?27 63. Partes importantes de la racionalidadCmo llevar a cabo Recopilacin deInformacin acciones con la intencin de modicarpercepciones futuras? Exploracin27 64. Partes importantes de la racionalidadCmo llevar a cabo Recopilacin deInformacin acciones con la intencin de modicarpercepciones futuras? Exploracin Aprendizaje sobre lo que se est percibiendo27 65. Entorno & AprendizajeEsSe un poco Acta de formanecesario conoce elNO!correcta, es frgilAprender? entorno?NO! SI! SI!No es Recopila necesario percibir y informacin yaprender aprende28 66. La conguracin inicial del agente puedereejar un conocimiento preliminar delentorno, pero a medida que el genteadquiere experiencia ste puedemodicarse y aumentar.Esto implica que el agente racional, ademsde recopilar informacin, aprenda lo mximo posible de lo que est percibiendo. 29 67. Los agentes de xito dividen las tareas de calcular la funcin de agente en tresperiodos diferentes Pensando en lasiguienteCuando Diseo operacinse est del aprendiendoprocesando de la agente clculos experiencia Clculos iniciales nuevos clculos El Agente decide cmo comportarse30 68. Autonoma y EvolucinHay algo comn?Si, ambos implican que se entreguen parmetros iniciales vitales y sucientes para que sepueda evolucionar/progresar. 31 69. Autonoma 32 70. Autonoma Entorno Se apoya ms en el conocimiento inicialque le proporciona eldiseador Carece de autonoma 32 71. Autonoma Entorno Entorno Sabe aprender de sus Se apoya ms en elpercepciones, conocimiento inicialcompensa elque le proporciona el conocimientodiseador incompleto oparcialAgente racional autnomo Carece de autonoma 32 72. Autonoma en los agentes33 73. Autonoma en los agentes Un agente racional debe ser autnomo, debe saber aprender a determinar cmo tiene que compensar el conocimiento incompleto o parcial inicial.33 74. Autonoma en losagentes Un agente racional debe ser autnomo, debe saber aprender a determinar cmo tiene que compensar el conocimiento incompleto o parcial inicial. Cuando el agente haya tenido poca o ninguna experiencia, tendr que actuar de forma aleatoria a menos que el diseador le haya proporcionado ayuda. 33 75. Autonoma en losagentes Un agente racional debe ser autnomo, debe saber aprender a determinar cmo tiene que compensar el conocimiento incompleto o parcial inicial. Cuando el agente haya tenido poca o ninguna experiencia, tendr que actuar de forma aleatoria a menos que el diseador le haya proporcionado ayuda. Es razonable entregar a los agentes que disponen de inteligencia articial un conocimiento inicial, as como la capacidad de aprendizaje.33 76. Claves con respecto a laautonoma34 77. Claves con respecto a laautonomaDespus de las sucientes experienciasde interaccin con el entorno, elcomportamiento del agente racionalser efectivamente independiente delconocimiento que posea inicialmente.34 78. La naturaleza del Entorno 35 79. 36 80. Los entornos de trabajo, son esencialmente los problemas para los que los agentes racionales son las soluciones.36 81. Entorno de TrabajoRendimiento SensoresEntorno Actuadores 37 82. Piense en un Robot Conductor La tarea de conducir un automvil, en su totalidad, es extremadamente ilimitada38 83. Descripcin REAS del entorno de trabajode un taxista automtico 39 84. Descripcin REAS del entorno de trabajode un taxista automtico Tipo de agente Taxista 39 85. Descripcin REAS del entorno de trabajode un taxista automtico Tipo de Medidas de agenterendimientoSeguro, rpido, legal, viaje Taxista confortable, maximizacin de benecio 39 86. Descripcin REAS del entorno de trabajode un taxista automtico Tipo de Medidas de Entorno agenterendimientoSeguro, rpido, legal, Carreteras, viajeotro trco, Taxista confortable,peatones, maximizacin clientes de benecio 39 87. Descripcin REAS del entorno de trabajode un taxista automtico Tipo de Medidas de Entorno Actuadores agenterendimientoSeguro,Direccin, rpido, legal, Carreteras,acelerador, viajeotro trco, Taxista freno, seal, confortable,peatones,bocina, maximizacin clientes visualizador de benecio 39 88. Descripcin REAS del entorno de trabajode un taxista automtico Tipo de Medidas de Entorno Actuadores Sensores agenterendimientoCmaras, sonar, velocmetro, Seguro,Direccin,GPS, rpido, legal, Carreteras,acelerador, tacmetro, viajeotro trco, Taxista freno, seal, visualizador confortable,peatones,bocina,de la maximizacin clientes visualizadoraceleracin, de benecio sensores de motor,teclado39 89. Ejemplos de tipos de Agentes Tablas de descripcin REAS: Rendimiento, Entorno, Actuadores, Sensores. 40 90. Ejemplo 1, Sistema de diagnstico mdico41 91. Ejemplo 1, Sistema de diagnstico mdicoTipo deagente Sistema de diagnstico mdico41 92. Ejemplo 1, Sistema de diagnstico mdicoTipo de Medidas deagenterendimiento Pacientes Sistema de sanos, reducir diagnsticocostes, mdico demandas41 93. Ejemplo 1, Sistema de diagnstico mdicoTipo de Medidas deEntornoagenterendimiento Pacientes Sistema de Pacientes, sanos, reducir diagnstico hospital,costes, mdico personal demandas41 94. Ejemplo 1, Sistema de diagnstico mdicoTipo de Medidas deEntornoActuadoresagenterendimientoVisualizar Pacientes preguntas, Sistema de Pacientes, sanos, reducir pruebas, diagnstico hospital,costes,diagnsticos, mdico personal demandastratamientos, casos 41 95. Ejemplo 1, Sistema de diagnstico mdicoTipo de Medidas deEntornoActuadoresSensoresagenterendimientoVisualizarTeclado para Pacientes preguntas,la entrada de Sistema de Pacientes, sanos, reducir pruebas,sntomas, diagnstico hospital,costes,diagnsticos, conclusiones, mdico personal demandastratamientos, respuesta de casos pacientes 41 96. 42 97. No es tan importante ladistincin entre un medio realy articial, sino la complejidadde la relacin entre el comportamiento del agente, la secuencia de percepcin generada por el medio y la medida de rendimiento42 98. Ejemplo 2, Sistema de anlisis de imgenes de satlites43 99. Ejemplo 2, Sistema de anlisis de imgenes de satlites Tipo de agenteSistema deanlisis de imgenes de satlites43 100. Ejemplo 2, Sistema de anlisis de imgenes de satlites Tipo de Medidas de agenterendimientoSistema deCategorizacinanlisis dede imagen imgenes de correcta satlites43 101. Ejemplo 2, Sistema de anlisis de imgenes de satlites Tipo de Medidas de Entorno agenterendimientoSistema de ConexinCategorizacinanlisis decon elde imagen imgenes de satlite en correcta satlites rbita43 102. Ejemplo 2, Sistema de anlisis de imgenes de satlites Tipo de Medidas de EntornoActuadores agenterendimientoSistema de ConexinCategorizacinVisualizar laanlisis decon elde imagencategorizacin imgenes de satlite en correctade una escena satlites rbita43 103. Ejemplo 2, Sistema de anlisis de imgenes de satlites Tipo de Medidas de EntornoActuadoresSensores agenterendimientoSistema de ConexinCategorizacinVisualizar la Matriz deanlisis decon elde imagencategorizacin pixeles de imgenes de satlite en correctade una escena colores satlites rbita 43 104. Ejemplo 3, Robot para la seleccin de componentes 44 105. Ejemplo 3, Robot para la seleccin de componentes Tipo de agente Robot para laseleccin de componentes 44 106. Ejemplo 3, Robot para la seleccin de componentes Tipo deMedidas de agente rendimiento Porcentaje de Robot para la componentesseleccin de clasicados en componentes los cuboscorrectos 44 107. Ejemplo 3, Robot para la seleccin decomponentes Tipo deMedidas deEntorno agente rendimiento Porcentaje de Cinta Robot para la componentes transportadorseleccin de clasicados ena con componentes los cubos componentescorrectoscubos44 108. Ejemplo 3, Robot para la seleccin decomponentes Tipo deMedidas de Entorno Actuadores agente rendimiento Porcentaje de Cinta Robot para la componentes transportador Brazo y manoseleccin de clasicados ena conarticulados componentes los cubos componentescorrectoscubos44 109. Ejemplo 3, Robot para la seleccin decomponentes Tipo deMedidas de Entorno Actuadores Sensores agente rendimiento Porcentaje de Cinta Robot para la componentes transportadorCmara, Brazo y manoseleccin de clasicados ena consensorarticulados componentes los cubos componentesangularcorrectoscubos 44 110. Ejemplo 4, Controlador de una renera45 111. Ejemplo 4, Controlador de una renera Tipo de agente Controlador de unarenera 45 112. Ejemplo 4, Controlador de una renera Tipo deMedidas de agente rendimiento Maximizar la Controladorpureza, de una produccin yrenera seguridad 45 113. Ejemplo 4, Controlador de una renera Tipo deMedidas de Entorno agente rendimiento Maximizar la Controladorpureza,Renera, de una produccin y operadoresrenera seguridad 45 114. Ejemplo 4, Controlador de una renera Tipo deMedidas de Entorno Actuadores agente rendimiento Maximizar laVlvulas, Controladorpureza,Renera,bombas, de una produccin y operadores calentadores,renera seguridadmonitores 45 115. Ejemplo 4, Controlador de una renera Tipo deMedidas de Entorno Actuadores Sensores agente rendimiento Maximizar laVlvulas, Temperatura, Controladorpureza,Renera,bombas, presin, de una produccin y operadores calentadores, sensoresrenera seguridadmonitoresqumicos45 116. Ejemplo 5, Tutor de ingls interactivo46 117. Ejemplo 5, Tutor de ingls interactivoTipo deagenteTutor deingls interactivo 46 118. Ejemplo 5, Tutor de ingls interactivoTipo de Medidas deagenterendimientoMaximizar laTutor de puntuacin deingls los interactivo estudiantes en los exmenes 46 119. Ejemplo 5, Tutor de ingls interactivoTipo de Medidas deEntornoagenterendimientoMaximizar laConjunto deTutor de puntuacin de estudiantes,ingls los agencia interactivo estudiantes enexaminadora los exmenes 46 120. Ejemplo 5, Tutor de ingls interactivoTipo de Medidas deEntorno ActuadoresagenterendimientoMaximizar laConjunto de Visualizar losTutor de puntuacin de estudiantes,ejercicios,ingls los agenciasugerencias, interactivo estudiantes enexaminadora correcciones los exmenes 46 121. Ejemplo 5, Tutor de ingls interactivoTipo de Medidas deEntorno Actuadores SensoresagenterendimientoMaximizar laConjunto de Visualizar losTutor de puntuacin de estudiantes,ejercicios, Teclado deingls los agenciasugerencias,entrada interactivo estudiantes enexaminadora correcciones los exmenes46 122. Welcome to Softbots, the homepage forresearch in intelligent software agents for theInternet at the University of Washington'sDepartment of Computer Science andEngineeringhttp://www.cs.washington.edu/research/projects/WebWare1/www/softbots/softbots.html http://www.links2go.com/LinksSearch?q=Agents http://www.youtube.com/user/therobotchannelSoftbots:1. Piense en un piloto automtico de vuelo2. Robot buscador de links relevantes en la webdotados de procesamiento de lenguaje natural47 123. Propiedades de los entornos de trabajo 48 124. Propiedades de losentornos de trabajo Totalmente observable vs parcialmente observable48 125. Propiedades de losentornos de trabajo Totalmente observable vs parcialmente observable Determinista vs estocstico48 126. Propiedades de losentornos de trabajo Totalmente observable vs parcialmente observable Determinista vs estocstico Episdico vs secuencial 48 127. Propiedades de losentornos de trabajo Totalmente observable vs parcialmente observable Determinista vs estocstico Episdico vs secuencial Esttico vs dinmico48 128. Propiedades de losentornos de trabajo Totalmente observable vs parcialmente observable Determinista vs estocstico Episdico vs secuencial Esttico vs dinmico Discreto vs continuo 48 129. Propiedades de losentornos de trabajo Totalmente observable vs parcialmente observable Determinista vs estocstico Episdico vs secuencial Esttico vs dinmico Discreto vs continuo Agente individual vs multiagente48 130. Totalmente observable/accesible vs parcialmente observable 49 131. Totalmente observable/accesible vs parcialmente observable 49 132. Totalmente observable/accesible vs parcialmente observable Totalmente observable Parcialmente observable 49 133. Totalmente observable/accesible vs parcialmente observableTotalmente observableParcialmente observableAcceso completo del medio y en cada momentoParcialmente observable debido alruido y a la existencia de sensorespoco exactos o que no reciben informacin de parte del sistema49 134. Totalmente observable/accesible vs parcialmente observable Totalmente observable Parcialmente observable Acceso completo del medio y encada momento Los sensores detectan los aspectos que son relevantes para la toma de Parcialmente observable debido al decisiones ruido y a la existencia de sensorespoco exactos o que no reciben informacin de parte del sistema49 135. Totalmente observable/accesible vs parcialmente observable Totalmente observable Parcialmente observable Acceso completo del medio y encada momento Los sensores detectan los aspectos que son relevantes para la toma de Parcialmente observable debido al decisiones ruido y a la existencia de sensoresLa relevancia, en cada momento, poco exactos o que no reciben depende de las medidas de informacin de parte del sistemarendimiento49 136. Totalmente observable/accesible vs parcialmente observable Totalmente observable Parcialmente observable Acceso completo del medio y encada momento Los sensores detectan los aspectos que son relevantes para la toma de Parcialmente observable debido al decisiones ruido y a la existencia de sensoresLa relevancia, en cada momento, poco exactos o que no reciben depende de las medidas de informacin de parte del sistemarendimiento Son convenientes porque el agenteno necesita mantener un estado interno para saber del mundo 49 137. Determinista Vs Estocstico 50 138. Determinista Vs Estocstico 50 139. Determinista Vs Estocstico Determinista Estocstico50 140. Determinista Vs Estocstico DeterministaEstocsticoCuando es difcil mantener Si el siguiente estado del medio est totalmente determinado por el estado actual y la accinconstancia de todos los aspectos ejecutada por el agente, entonces se dice que elobservadosentorno es determinista 50 141. Determinista Vs Estocstico DeterministaEstocsticoCuando es difcil mantener Si el siguiente estado del medio est totalmente determinado por el estado actual y la accinconstancia de todos los aspectos ejecutada por el agente, entonces se dice que elobservadosentorno es deterministaNo hay incertidumbre si el ambienteSi el medio es parcialmente es totalmente observable yobservable puede parecer determinista estocstico 50 142. Determinista Vs Estocstico DeterministaEstocsticoCuando es difcil mantener Si el siguiente estado del medio est totalmente determinado por el estado actual y la accinconstancia de todos los aspectos ejecutada por el agente, entonces se dice que elobservadosentorno es deterministaNo hay incertidumbre si el ambienteSi el medio es parcialmente es totalmente observable yobservable puede parecer determinista estocstico Es mejor pensar pensar en entornos deterministas o estocsticos desde elpunto de vista del agente 50 143. Determinista Vs Estocstico DeterministaEstocsticoCuando es difcil mantener Si el siguiente estado del medio est totalmente determinado por el estado actual y la accinconstancia de todos los aspectos ejecutada por el agente, entonces se dice que elobservadosentorno es deterministaNo hay incertidumbre si el ambienteSi el medio es parcialmente es totalmente observable yobservable puede parecer determinista estocstico Es mejor pensar pensar en entornos deterministas o estocsticos desde elpunto de vista del agente Si el medio es determinista, excepto para las acciones de otros agentes, decimos que el medio es estratgico50 144. Episdico vs Secuencial 51 145. Episdico vs Secuencial 51 146. Episdico vs Secuencial Episdico Secuencial51 147. Episdico vs Secuencial EpisdicoSecuencialEn un entorno de trabajo episdico,la decisin presente puede afectar las la experiencia del agente se divide endecisiones futurasepisodios atmicos 51 148. Episdico vs Secuencial EpisdicoSecuencialEn un entorno de trabajo episdico,la decisin presente puede afectar las la experiencia del agente se divide endecisiones futurasepisodios atmicos Cada episodio consiste en laLas acciones a corto plazo pueden percepcin del agente y la realizacintener consecuencias a largo plazode una nica accin posterior. 51 149. Episdico vs Secuencial EpisdicoSecuencialEn un entorno de trabajo episdico,la decisin presente puede afectar las la experiencia del agente se divide endecisiones futurasepisodios atmicos Cada episodio consiste en laLas acciones a corto plazo pueden percepcin del agente y la realizacintener consecuencias a largo plazode una nica accin posterior. El siguiente episodio no depende de Son ms complejos que los las acciones que se realizaron enepisdicos episodios previos 51 150. Episdico vs Secuencial EpisdicoSecuencialEn un entorno de trabajo episdico,la decisin presente puede afectar las la experiencia del agente se divide endecisiones futurasepisodios atmicos Cada episodio consiste en laLas acciones a corto plazo pueden percepcin del agente y la realizacintener consecuencias a largo plazode una nica accin posterior. El siguiente episodio no depende de Son ms complejos que los las acciones que se realizaron enepisdicos episodios previosLa eleccin de la accin en cadaSe necesita pensar teniendo en episodio depende slo del episodio cuenta Tiempoen s mismo51 151. Esttico Vs Dinmico52 152. Esttico Vs Dinmico52 153. Esttico Vs Dinmico EstticoDinmico52 154. Esttico Vs Dinmico Esttico DinmicoLos medios estticos son fciles de El entorno puede cambiar cuando el agente est deliberando. tratar ya que el agente no necesita estar pendiente del mundo Estos medios estn preguntando continuamente al agente qumientras est tomando una decisinsobre una accin, ni necesitaquiere hacer; sino se ha decidido, preocuparse sobre el paso del se entiende que ha decidido no hacer tiempo.nada.52 155. Esttico Vs Dinmico Esttico DinmicoLos medios estticos son fciles de El entorno puede cambiar cuando el agente est deliberando. tratar ya que el agente no necesita estar pendiente del mundo Estos medios estn preguntando continuamente al agente qumientras est tomando una decisinsobre una accin, ni necesitaquiere hacer; sino se ha decidido, preocuparse sobre el paso del se entiende que ha decidido no hacer tiempo.nada.Si el entorno no cambia con el paso del tiempo, pero el rendimiento del agente cambia, entonces se dice que el medio es semidinmico.52 156. Discreto Vs Continuo53 157. Discreto Vs Continuo53 158. Discreto Vs Continuo Discreto Continuo 53 159. Discreto Vs Continuo Discreto Continuo El estado del medio, en que se maneja el tiempo y a las percepciones/acciones del agente. 53 160. Agente Individual Vs Multiagente54 161. Agente Individual Vs Multiagente54 162. Agente Individual Vs MultiagenteAgente Individual MultiAgente54 163. Agente Individual Vs Multiagente Agente IndividualMultiAgente Una entidad puede percibirse como un agente Maximizacin de rendimiento de Agente 1 estn en funcin del Agente 2 54 164. Multi Agente Competitivo yCooperativo55 165. Multi Agente Competitivo yCooperativo55 166. Multi Agente Competitivo y Cooperativo MultiAgente Competitivo MultiAgente Cooperativo 55 167. Multi Agente Competitivo y Cooperativo MultiAgente CompetitivoMultiAgente CooperativoEl agente A intenta maximizar su rendimiento a costa del rendimiento del otro agente B?Cul es el proceso de comunicacin entre agente55 168. El caso ms complejo es el parcialmenteobservable, estocstico, secuencial, dinmico, continuo y multiagenteLas situaciones reales son tan complejasque sera discutible clasicarlas comorealmente deterministas, a efectos prcticos se deben tratar como estocsticas56 169. Ejemplos de entornos de trabajo y sus caractersticas 57 170. Ejemplos de entornos de trabajo y sus caractersticas 57 171. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista Episdico Esttico Discreto Agentes 57 172. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual 57 173. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto Multi 57 174. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto Multi 57 175. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto MultiBackgammonTotalmente EstocsticoSecuencial Esttico Discreto Multi 57 176. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto MultiBackgammonTotalmente EstocsticoSecuencial Esttico Discreto MultiTaxi circulando Parcialmente EstocsticoSecuencial Dinmico Continuo Multil 57 177. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto MultiBackgammonTotalmente EstocsticoSecuencial Esttico Discreto MultiTaxi circulando Parcialmente EstocsticoSecuencial Dinmico Continuo MultilDiagnstico mdicoParcialmente EstocsticoSecuencial Dinmico Continuo Individual 57 178. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto MultiBackgammonTotalmente EstocsticoSecuencial Esttico Discreto MultiTaxi circulando Parcialmente EstocsticoSecuencial Dinmico Continuo MultilDiagnstico mdicoParcialmente EstocsticoSecuencial Dinmico Continuo IndividualAnlisis de imagenTotalmente Determinista Episdico SemiContinuo Individual 57 179. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajo Observable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con relojTotalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto MultiBackgammonTotalmente EstocsticoSecuencial Esttico Discreto MultiTaxi circulando Parcialmente EstocsticoSecuencial Dinmico Continuo MultilDiagnstico mdicoParcialmente EstocsticoSecuencial Dinmico Continuo IndividualAnlisis de imagenTotalmente Determinista Episdico SemiContinuo IndividualRobot ClasificadorParcialmente EstocsticoEpisdico Dinmico ContinuoIndividual 57 180. Ejemplos de entornos de trabajo y sus caractersticasEntornos de trabajoObservable Determinista EpisdicoEsttico Discreto AgentesCrucigrama Totalmente Determinista Secuencial Esttico Discreto Individual Ajedrez con reloj Totalmente EstratgicoSecuencialSemiDiscreto Multi Pker Parcialmente EstratgicoSecuencial Esttico Discreto Multi BackgammonTotalmente EstocsticoSecuencial Esttico Discreto MultiTaxi circulandoParcialmente EstocsticoSecuencial Dinmico Continuo MultilDiagnstico mdico Parcialmente EstocsticoSecuencial Dinmico Continuo IndividualAnlisis de imagen Totalmente Determinista Episdico SemiContinuo IndividualRobot Clasificador Parcialmente EstocsticoEpisdico Dinmico ContinuoIndividualControlador de refinara Parcialmente EstocsticoSecuencial Dinmico Continuo Individual57 181. Ejemplos de entornos de trabajo y sus caractersticas Entornos de trabajoObservable Determinista EpisdicoEsttico Discreto Agentes Crucigrama Totalmente Determinista Secuencial Esttico Discreto IndividualAjedrez con reloj Totalmente EstratgicoSecuencialSemiDiscreto MultiPker Parcialmente EstratgicoSecuencial Esttico Discreto MultiBackgammonTotalmente EstocsticoSecuencial Esttico Discreto Multi Taxi circulandoParcialmente EstocsticoSecuencial Dinmico Continuo Multil Diagnstico mdico Parcialmente EstocsticoSecuencial Dinmico Continuo Individual Anlisis de imagen Totalmente Determinista Episdico SemiContinuo Individual Robot Clasificador Parcialmente EstocsticoEpisdico Dinmico ContinuoIndividual Controlador de refinara Parcialmente EstocsticoSecuencial Dinmico Continuo IndividualTutor interactivo de ingls Parcialmente EstocsticoSecuencial Dinmico Discreto Multi 57 182. Estructura de los Agentes 58 183. =+ Agente Arquitectura ProgramaLa IA, se centra en disear el programa que implemente la funcin del agente que proyecta las percepciones en las acciones.59 184. Sensores Fotoelctricos Proximidad HumedadTablero Sensores 60 185. Ejemplo Construccinhttp://www.gia.usb.ve/robotica/telemaco/construccion.htm El primer paso para la construccin del robot es armar el chasis. Esta es la estructura de soporte donde se emplazaran el resto de las partes. Esta estructura debe ser rgida y capaz de sostener el peso que se le va a colocar.61 186. Una de la parte ms importante del armado del robot es colocar los sensores. Estosdeben ser protegidos contra el ruido propio que provee el ambiente donde el robot seinte-relaciona. El montaje involucra tres fases: 1. Montaje de Fotoceldas: Estas se 2. Sensor lineal: se colocan en las colocan en una torre que permite bocas triangulares del robot para obtener una mejor panormica aldetectar la interrupcin que rango de visin del sensor.produce la entrada de una pelota. 62 187. 4. Sensores de impacto: Estos 3. Sensores de color: Este sensor sensores, colocados en el permitir identicar el color de la parachoque, permiten detectar si pelota capturada. Se coloca en la ha ocurrido una colisin frontal. parte de tope de la boca de captura. 63 188. Programas de los agentes Reciben las percepciones actuales como entradas de los sensores y devuelven una accin a los actuadores Los programas reciben slo la percepcin actual como entrada porque no hay nada ms disponible en el entorno. Si las acciones del agente dependen de la secuencia completa de percepciones, el agente tendra que recordar las percepciones.64 189. Funcin agente dirigido mediante tablafuncin agente-dirigido-mediante tabla (percepcin) devuelve unaaccin variables estticas:percepciones, una secuencia, vaca inicialmentetabla, una tabla de acciones, indexada por las secuencias de percepciones, totalmente denidas inicialmente aadir la percepcin al nal de las percepcionesaccin