Sergio Márquez Dev @sergiomzdev X Profile

Sergio Márquez Dev

@sergiomzdev

Followers

337

Following

289

Media

4

Statuses

451

Automation | AI/ML | Backend Developer 📜 https://t.co/0CFc4S0qCv 🎥 https://t.co/Z4hc7Q6cqM

Madrid, Comunidad de Madrid

Joined August 2012

Don't wanna be here? Send us removal request.

Sergio Márquez Dev

@sergiomzdev

8 hours

TD3 es clave para sistemas autónomos. Para la teoría, código PyTorch y aplicaciones reales en robótica/IA, lee la guía completa. 👇 ¿Tu mayor reto en RL? #IA #ML #RL #PyTorch #Robotica.

blog.sergiomarquez.dev

El control continuo es un desafío clave en el Aprendizaje por Refuerzo, especialmente para aplicaciones como la robótica y los vehículos autónomos, donde las acciones no son discretas sino que varían...

0

Sergio Márquez Dev

@sergiomzdev

8 hours

TD3 no es solo teoría. Se usa en robótica (brazos, humanoides), vehículos autónomos, control industrial y finanzas. Para optimizarlo: normaliza datos, usa buen ruido de exploración y ajusta hiperparámetros. ¡Clave para el éxito! ✨.

1

0

Sergio Márquez Dev

@sergiomzdev

8 hours

Implementar TD3 en PyTorch es más sencillo de lo que crees. Necesitas Actor, Crítico (doble), y Replay Buffer. El código es clave para entender cómo los 3 pilares de TD3 se traducen en un agente robusto. 💻.

1

0

Sergio Márquez Dev

@sergiomzdev

8 hours

Ahí entra TD3. Mejora DDPG con 3 claves: 1️⃣ Doble Crítico (evita sobreestimación). 2️⃣ Actualizaciones Retrasadas (más estabilidad). 3️⃣ Suavizado de Política Objetivo (más robustez). Esto lo hace ideal para control fino. 🦾.

1

0

Sergio Márquez Dev

@sergiomzdev

8 hours

El RL es brutal en juegos, pero en robótica o vehículos autónomos, las acciones son CONTINUAS. Q-Learning no sirve. DDPG intentó resolverlo, pero fallaba por inestabilidad y sobreestimación. ¿Cómo lo superamos? 👇.

1

0

Sergio Márquez Dev

@sergiomzdev

8 hours

Tu IA falla en robótica por esto. 🤖 La mayoría ignora el control continuo. Te muestro cómo TD3 en PyTorch lo resuelve, paso a paso. 🧵.

1

0

Sergio Márquez Dev

@sergiomzdev

1 day

Dominar la evaluación de LLMs es tan crucial como construirlos. Con LLM-as-a-Judge, DeepEval y Ragas, tus modelos serán robustos y fiables en producción. Aprende a implementarlo ya: ¿Qué métrica te preocupa más en tus LLMs?.

blog.sergiomarquez.dev

La evaluación de Modelos de Lenguaje de Gran Escala (LLMs) en entornos de producción es un desafío complejo que va más allá de las métricas tradicionales como BLEU o ROUGE. Este artículo profundiza...

0

Sergio Márquez Dev

@sergiomzdev

1 day

¿Cómo implementar esto? Con frameworks como DeepEval (unit testing para LLMs, tipo Pytest) y Ragas (específico para pipelines RAG). Integran evaluación continua en tu CI/CD. ¡Código y ejemplos en el blog!.

1

0

Sergio Márquez Dev

@sergiomzdev

1 day

Más allá del juez: métricas avanzadas. Para RAG, son vitales: Relevancia de Respuesta, Fidelidad (adiós alucinaciones), Precisión y Recuperación Contextual. Asegura que tu IA sea precisa y fiable. 📊.

1

0

Sergio Márquez Dev

@sergiomzdev

1 day

Solución: LLM-as-a-Judge. Usa un LLM 'juez' para evaluar a otro. Es escalable, consistente y capta matices (tono, alucinaciones). Ideal para QA automatizado. ¡Pero ojo con los sesgos y la dependencia del prompt!.

1

0

Sergio Márquez Dev

@sergiomzdev

1 day

Las métricas clásicas (BLEU, ROUGE) son limitadas en producción. ¿Por qué? No capturan la sutileza, relevancia o coherencia real de un LLM. Necesitas evaluación extrínseca, no solo intrínseca. Es clave para el éxito en apps reales.

1

0

Sergio Márquez Dev

@sergiomzdev

1 day

¿Evalúas tus LLMs con BLEU/ROUGE? 🚨 Error común. La mayoría de modelos en producción fallan por no ir más allá. Descubre cómo los ingenieros top evalúan LLMs en el mundo real y evitan desastres. Hilo 🧵.

1

0

Sergio Márquez Dev

@sergiomzdev

7 days

Domina el despliegue de IA en el borde. La guía completa con código y mejores prácticas para TensorFlow Lite: #EdgeAI #TensorFlowLite #MLOps ¿Cuál es tu mayor desafío al desplegar modelos en dispositivos?.

blog.sergiomarquez.dev

Este artículo proporciona una guía completa para desarrolladores sobre cómo llevar modelos de IA/ML a la producción en dispositivos de borde utilizando TensorFlow Lite. Exploraremos la necesidad de...

0

Sergio Márquez Dev

@sergiomzdev

7 days

No solo cuantifiques. Elige arquitecturas ligeras como MobileNet o EfficientNet Lite. Además, usa `Delegates` (GPU, NNAPI, Edge TPU) para acelerar la inferencia hasta 10x en hardware específico. ¡Crucial para rendimiento real!.

1

0

Sergio Márquez Dev

@sergiomzdev

7 days

La clave para Edge AI: Cuantificación. Reduce modelos de FP32 a INT8/FP16. ¡Hasta 4x más pequeños y rápidos! Usa `tf.lite.Optimize.DEFAULT` y `representative_dataset` para INT8. Es el 80% de la optimización.

1

0

Sergio Márquez Dev

@sergiomzdev

7 days

La IA en la nube es cara y lenta. ¿La solución? Edge AI. Pero desplegar modelos complejos en dispositivos limitados es el desafío. Aquí te revelo las técnicas que Google usa para optimizar modelos con TensorFlow Lite. 👇.

1

0

Sergio Márquez Dev

@sergiomzdev

7 days

Si no estás optimizando tus modelos de IA para Edge en 2025, ya estás atrás. El 78% de los proyectos fallan por esto. Te muestro cómo evitarlo y dominar TensorFlow Lite 🧵.

1

0

Sergio Márquez Dev

@sergiomzdev

7 days

La metodología completa para dominar los datos sintéticos y no quedarte atrás en la revolución de la IA: #AIDatosSinteticos #OptimizaciónIA ¿Estás listo para esta revolución o sigues con datos reales?.

blog.sergiomarquez.dev

La adquisición de datos reales es un cuello de botella costoso y lento para los proyectos de IA, plagado de problemas de privacidad y escasez. Sin embargo, los líderes de la industria están adoptando...

0

Sergio Márquez Dev

@sergiomzdev

7 days

El futuro es sintético: Waabi y NVIDIA usan datos sintéticos en vehículos autónomos para billones de km de datos sin riesgo. Writer entrena LLMs más eficientes. Salud y finanzas blindan privacidad. ¡Esto ya es una realidad que ahorra millones y acelera la innovación!.

1

0

Sergio Márquez Dev

@sergiomzdev

7 days

2. Blindaje de Privacidad y Adiós al Sesgo: Entrena modelos con datos sensibles (salud, finanzas) sin exponer info real. ¡Cumple GDPR/HIPAA sin sudar! Además, crea datasets equilibrados para reducir sesgos y mejorar la equidad de tus modelos.

1

0