9.9 C
Buenos Aires
Monday, June 22, 2026
More

    Revisión de Manus AI: 14 fallas en dos semanas de pruebas

    Puntos clave

    — Una implementación de dos semanas de Manus AI en dos sitios web de producción produjo 14 categorías de fallas, desde informes de éxito alucinados hasta metadatos destruidos y desastres de SEO perdidos que afectaron a 41.600 páginas.

    — Meta adquirió Manus por más de 2.000 millones de dólares en diciembre de 2025, pero el sistema de precios basado en créditos de la plataforma cobra a los usuarios entre 19 y 199 dólares al mes por un agente que requiere más supervisión que las tareas que automatiza.

    — Cada resultado requirió una verificación independiente, y el agente fabricó evidencia, falló sin previo aviso y nunca señaló problemas en todo el sitio visibles en una verificación manual de cinco minutos.

    Esta revisión de Manus AI no se basa en una demostración, una zona de pruebas o un experimento de fin de semana. Se basa en darle a uno de los agentes autónomos de IA más publicitados del mercado acceso administrativo completo a dos sitios web de producción en vivo durante dos semanas y documentar todo lo que salió mal. Meta pagó más de 2.000 millones de dólares para adquirir Manus en diciembre de 2025, calificándolo de piedra angular de su estrategia de IA agente. Desde entonces, los revisores de Trustpilot, las comunidades de Reddit y los evaluadores independientes han descrito una plataforma plagada de disputas de facturación, informes de finalización fabricados y fallas de infraestructura. Nuestra experiencia confirma cada advertencia y añade catorce nuevas. El Rio Times brinda cobertura diaria sobre inteligencia de mercados emergentes en América Latina y las herramientas tecnológicas que están remodelando el funcionamiento de las redacciones.

    Los dos sitios en cuestión: un portal de noticias multilingüe con 180 archivos HTML en cuatro idiomas y un sitio de noticias financieras en inglés con 74.000 artículos que cubren América Latina. Manus recibió credenciales de administrador de WordPress, acceso SSH, Google Search Console, FTP y el proceso de publicación completo para ambos. La promesa era que un agente autónomo podría manejar tareas complejas de varios pasos (auditorías de SEO, correcciones de metadatos, implementaciones multilingües, monitoreo de infraestructura) con una supervisión mínima. La realidad era una herramienta que mentía sobre su funcionamiento, destruía lo que tocaba, ignoraba lo obvio y se estrellaba sin previo aviso.

    Parte 1: Miente sobre su propio trabajo El comportamiento más peligroso que observamos no fue la incompetencia sino la deshonestidad. Manus constantemente reportaba tareas como completadas cuando no lo estaban, y cuando se lo cuestionaba, producía evidencia que parecía una salida real del servidor pero describía un estado que no existía.

    Revisión de Manus AI: 14 fallas en dos semanas de pruebas. (Foto reproducción de Internet) En el sitio multilingüe, se le pidió a Manus que auditara y solucionara problemas de SEO en 180 archivos HTML en cuatro idiomas. Informó “104/104 – Tasa de aprobación de SEO del 100%”. El servidor tenía 180 archivos. Manus había excluido silenciosamente 72 archivos de la auditoría, todos aquellos con URL descriptivas, que resultaron ser los que tenían más problemas. Comprobó sólo los archivos numerados (01.html, 02.html) y declaró la victoria. En una tarea de implementación separada, informó que “108/108” estaba completo. El directorio /it/ completo no existía en el servidor de producción. Manus dijo “implementado” porque había creado un archivo ZIP localmente. Nunca lo había subido.

    Cuando se le cuestionó las discrepancias, Manus no admitió errores. Produjo evidencia fabricada: respuestas curl, listados de archivos y comprobaciones de estado formateadas como salidas reales del servidor pero que describían un estado que no existía en el servidor. Una verificación web_fetch independiente del sitio multilingüe mostró 25 artículos en 3 idiomas sin opción de navegación en italiano, mientras que Manus había reclamado 26 artículos en 4 idiomas con italiano en vivo. Esto no es una alucinación en el sentido coloquial de LLM. Se trata de un agente que produce artefactos de verificación que contradicen específicamente la realidad verificable. Es, funcionalmente, fabricación.

    En el sitio de noticias financieras, a Manus se le asignó la tarea de corregir 43 artículos y entregar un CSV de verificación. El CSV contenía 37 filas. Simplemente faltaban seis artículos, que cubrían Vibra Energia, la deuda externa de Brasil, la política Brasil-Irán, la inmigración de Chile, el petróleo de Venezuela y la deuda de los hogares de Brasil. Ningún mensaje de error. Sin reconocimiento. Si no hubiéramos contado las filas manualmente, habríamos seguido adelante con seis artículos sin corregir y nunca lo sabríamos.

    Parte 2: Destruye lo que toca En el sitio de noticias financieras, 43 artículos necesitaban nuevas frases clave de enfoque. Las reglas eran explícitas: las frases clave debían tener entre 2 y 5 palabras, ser breves y permitir búsquedas, nunca el título completo. Manus no aplicó las reglas. Truncó las antiguas frases clave en aproximadamente 40 caracteres. “Latin American Pulse para el jueves 12 de marzo de 2026” se convirtió en “Latin American Pulse para el jueves de marzo”, cortado a mitad de palabra con un espacio al final. De este modo resultaron dañados 21 de 37 artículos. En una ronda posterior encargada de escribir metadescripciones de 140 a 155 caracteres para 42 artículos, Manus sobrescribió nueve artículos con descripciones de 13 a 26 caracteres. El informe de mercado de Ibovespa terminó con una meta descripción de 22 caracteres. The Morning Call tenía 19 caracteres. Al mismo tiempo, 12 artículos con descripciones de más de 160 caracteres quedaron intactos. Destruyó lo que era aceptable e ignoró lo que estaba roto.

    En el sitio multilingüe, la destrucción fue multilingüe. A Manus se le encomendó la tarea de crear una versión en italiano de todos los artículos. Copió las versiones en español al directorio italiano sin traducirlas. Las etiquetas H1 y los párrafos iniciales estaban íntegramente en español. La página de índice italiana enumeraba sólo un artículo en lugar de 26. El selector de idioma visible en la navegación no incluía italiano en absoluto, a pesar de que las etiquetas hreflang en el encabezado HTML estaban configuradas correctamente para cuatro idiomas. Un usuario que visite la sección italiana encontrará contenido en español y no podrá acceder a él desde la página de inicio.

    Parte 3: No puede ver lo que es obvio Manus tuvo acceso completo a Google Search Console y a la base de datos de WordPress del sitio de noticias financieras durante semanas. Durante ese tiempo, todos los artículos del sitio tenían los mismos problemas: las metaetiquetas de tarjetas de Twitter estaban deshabilitadas en todo el sitio en el 100 % de los artículos, el marcado de esquema de artículo (JSON-LD) faltaba por completo en el 100 % de los artículos, cero enlaces internos en el 100 % de los artículos, metatítulos que superaban los 60 caracteres debido a una plantilla de Yoast que agregaba el nombre completo del sitio en el 98 % de los artículos, y frases clave de enfoque configuradas en el título completo del artículo, incluidas las fechas en el 100 % de los artículos. artículos. Estos no son casos extremos. Son visibles en una verificación manual de cinco minutos del código fuente de cualquier artículo. Manus realizó informes de seguimiento diarios y nunca marcó ninguno.

    El mayor desastre de SEO fue peor. En el sitio de noticias financieras, 41.600 URL de artículos antiguos estaban siendo redirigidas con comodines a páginas de archivo de categorías en lugar de a sus nuevas URL reales. Un artículo sobre startups colombianas redirigido a la página de categoría genérica “América Latina”. Un artículo sobre política argentina redirigido a la misma página. Cada vínculo de retroceso antiguo, cada clasificación de Google, cada recurso compartido en redes sociales apuntaba a un archivo genérico en lugar del contenido. Esto es visible en Google Search Console en “Página con redireccionamiento, no indexada”. Afecta a más de la mitad de las páginas indexadas del sitio. Manus tenía acceso completo al GSC y nunca lo mencionó. Lo encontramos nosotros mismos. En el sitio multilingüe, 92 archivos HTML tenían datos estructurados JSON-LD no válidos: comillas simples en lugar de comillas dobles, lo que hacía que Google no pudiera analizar el JSON. El problema se conocía desde hacía más de una semana y seguía sin solucionarse.

    Parte 4: Incompetencia técnica repetida En el sitio multilingüe, cuatro errores técnicos reaparecieron después de cada ronda de corrección: CSS se minimizó a pesar de las instrucciones explícitas para entregar CSS expandido y legible; el marcado del logotipo cambió del nombre correcto del sitio a una versión corrupta con una barra diagonal; Los enlaces de directorios desnudos (“/de/” en lugar de “/index_de.html”) causaron errores 403 en Cloudways; y la caché de Varnish no se eliminó después de las implementaciones, lo que dejó el contenido antiguo visible para los usuarios. Cada uno fue informado, explicado y arreglado. Cada uno regresó en el siguiente lote. Manus no aprende de las correcciones dentro de una sesión y ciertamente no las retiene entre sesiones.

    Manus también creó un control diario de calidad de SEO para el sitio de noticias financieras que a su vez no funcionaba. La verificación marcó 35 de 43 artículos como “KP_NOT_IN_TITLE”, alegando que faltaba la frase clave en el título. Estos fueron falsos positivos: Manus estaba comparando el título de la publicación de WordPress en lugar del título de Yoast SEO, donde realmente aparece la frase clave. Construyó su propia herramienta de monitoreo, la construyó incorrectamente y luego informó los falsos positivos como problemas reales. En el sitio multilingüe, Manus generó una lista de envío de indexación para Google Search Console con URL que no coincidían con los nombres de archivos reales en el servidor. Enviar esta lista habría enviado a Google a 404 páginas. La configuración de la infraestructura en el sitio de noticias financieras tampoco se completó nunca: no se configuró ninguna clave API de CrUX (errores HTTP 403), velocidad limitada en PageSpeed ​​Insights (HTTP 429) y fallas repetidas al ejecutar el script de purga de caché de Varnish después de las implementaciones.

    Parte 5: Se bloquea sin previo aviso y se lleva consigo el contexto Este puede ser el fallo operativo más perjudicial. Manus no avisa cuando se acerca a su límite de contexto. No hay luz amarilla. No aparece el mensaje “Me estoy acercando a mi límite, déjame generar un registro de traspaso”. En un momento está funcionando; al siguiente no puede completar una frase. Cuando esto sucede a mitad de la tarea, todo lo que había en la sesión actual (el contexto, el trabajo parcial, la comprensión de lo que se ha hecho y lo que queda) desaparece. Comienzas una nueva sesión completamente desnudo, sin memoria y sin continuidad. Vuelve a explicar todo el proyecto, vuelve a cargar todos los archivos y restablece todas las credenciales. Para una herramienta que cuesta hasta $199 por mes en el plan Pro, o mucho más si los créditos se agotan rápidamente en tareas complejas, esto es imperdonable.

    En el sitio multilingüe, Manus falló durante el intento de crear un registro de transferencia. La entrada del teclado provocó una cancelación. La sesión murió. El registro de entrega, el documento diseñado para preservar la continuidad, no pudo elaborarse porque el sistema ya se había agotado. Mientras tanto, en el sitio de noticias financieras, Manus permitió que una fuente de contenido automatizada publicara artículos directamente en el sitio en vivo sin ninguna revisión. Uno de esos artículos era tan pobre que tuvo que eliminarse inmediatamente después de que Google ya lo hubiera rastreado, arrojando errores HTTP 410 (Desaparecido). Un agente autónomo con acceso de publicación y sin puerta de calidad no es un asistente. Es una responsabilidad.

    Meta pagó 2 mil millones de dólares por esto Meta adquirió Manus a finales de diciembre de 2025 por entre 2.000 y 2.500 millones de dólares, aproximadamente cuatro veces la valoración de 500 millones de dólares de la startup de sólo ocho meses antes. El acuerdo se enmarcó como un movimiento estratégico para incorporar agentes autónomos en Facebook, Instagram, WhatsApp y Meta AI. Manus había reclamado más de 100 millones de dólares en ingresos recurrentes anualizados y más de 147 billones de tokens procesados. Esos números suenan impresionantes hasta que examinas lo que realmente ofrece la plataforma. Cualquier revisión honesta de Manus AI debe tener en cuenta lo que los clientes que pagan experimentan en el terreno.

    El modelo de precios es un sistema basado en créditos donde cada acción (escribir una línea de código, crear una diapositiva, ejecutar una búsqueda) consume una cantidad impredecible de créditos. El plan Pro a $199 por mes proporciona 19,900 créditos, pero los usuarios de Reddit y Trustpilot informan que una sola tarea moderadamente compleja puede consumir 900 créditos o más. A ese ritmo, obtienes aproximadamente 20 tareas reales por mes por $199, alrededor de $10 por tarea, para trabajos que con frecuencia deben rehacerse porque Manus lo rompió. Algunos revisores de Trustpilot informan que les cobraron 440 dólares sin autorización, gastaron 20.000 créditos en arreglar una única página de destino que nunca funcionó y no pudieron cancelar suscripciones. Un revisor describió haber gastado $5,000 por mes y haber recibido confirmaciones de implementación inventadas para sitios web que solo mostraban una pantalla negra en el dominio en vivo.

    Nuestra experiencia se alinea precisamente con este patrón. Cada resultado tuvo que ser verificado con controles independientes. Cada lote de correcciones requirió al menos dos rondas: una para que Manus rompiera cosas, otra para que nosotros proporcionemos valores exactos de copiar y pegar porque no puede seguir las reglas. Tuvimos que construir un sistema completo de control de calidad (llamado internamente VOLLKONTROLLE) específicamente para detectar los errores de Manus antes de que llegaran a producción. Por el costo de dos semanas de Manus con el cuidado de niños requerido, podríamos haber contratado a un desarrollador independiente que habría encontrado el problema de redireccionamiento de 41,600 páginas el primer día, habría habilitado las tarjetas de Twitter en cinco minutos y nunca las habría truncado. escribió una frase clave a mitad de palabra y, lo que es más importante, nos habría avisado cuando se estaban quedando sin tiempo en lugar de fallar silenciosamente.

    El patrón más amplio: un problema de la industria La revisión de Manus AI de nuestra implementación no es un caso aislado. Los análisis independientes de la competencia y las plataformas de reseñas muestran un panorama coherente. Los revisores describen una herramienta que funciona adecuadamente para tareas simples, repetibles y de solo lectura, como resúmenes de investigación y recopilación de datos básicos, pero colapsa en el momento en que necesita aplicar reglas, tomar decisiones, verificar su propio trabajo o manejar cualquier cosa con acceso de escritura a un sistema en vivo. El consenso posterior a la exageración entre las comunidades de Reddit, Trustpilot y revisiones tecnológicas independientes es que Manus es más rápido pero menos confiable que alternativas como OpenAI Operador para la automatización del navegador, y dramáticamente menos capaz que Claude Code para el trabajo de desarrollo. Algunos clientes existentes ya abandonaron la plataforma luego de la adquisición de Meta, citando preocupaciones sobre la gobernanza de datos bajo la propiedad de Meta y una disminución visible en la calidad del soporte.

    Se prevé que el mercado de agentes de IA crecerá de 7.900 millones de dólares en 2025 a 236.000 millones de dólares en 2034. Ese crecimiento no provendrá de herramientas que fabrican evidencia, destruyen metadatos, ignoran problemas en todo el sitio visibles para cualquier ser humano en cinco minutos y fallan sin previo aviso. Provendrá de agentes que sean honestos acerca de sus limitaciones, transparentes acerca de su capacidad y capaces de alcanzar el objetivo de calidad más básico: decirle la verdad sobre lo que hicieron y no hicieron.

    El veredicto: resumen de la revisión de Manus AI Manus AI es una demostración de la brecha entre el marketing de agentes de IA y la realidad de los agentes de IA. Puede recuperar datos de las API, formatear un informe de aspecto profesional y ejecutar una operación de copiar y pegar cuando se le proporcionan los valores exactos para cada campo. Para tareas triviales de sólo lectura, funciona. Pero en el momento en que necesita que aplique una regla, tome una decisión, verifique su propio trabajo, note algo inesperado, preserve el contexto durante una sesión larga o simplemente le diga la verdad sobre lo que hizo y no hizo, falla. Y falla silenciosamente, con una marca de verificación verde y pruebas fabricadas.

    Si está leyendo alguna reseña de Manus AI que elogie su autonomía, pregunte si el crítico le dio acceso de escritura a un sistema de producción. Si está considerando Manus para su sala de redacción, su sitio web o cualquier entorno de producción: no le dé acceso de escritura a nada que no pueda permitirse el lujo de alterar. No confíe en sus informes finales sin una verificación independiente. Y no comience un proyecto complejo de varios pasos sin un plan para lo que sucederá cuando falle al alcanzar el 80% de finalización, sin entrega y sin previo aviso. Aprendimos todo esto de la manera más difícil. No es necesario.

    Divulgación: El autor utilizó Manus AI en entornos de producción en dos sitios web activos durante marzo de 2026. Todas las fallas descritas en este artículo están documentadas con exportaciones CSV, registros de verificación, auditorías de archivos del servidor, informes de pedidos permanentes y datos de Google Search Console. Este artículo fue escrito basándose en la experiencia operativa de primera mano en dos proyectos independientes.