sergiomzdev Profile Banner
Sergio Márquez Dev Profile
Sergio Márquez Dev

@sergiomzdev

Followers
337
Following
289
Media
4
Statuses
451

Automation | AI/ML | Backend Developer 📜 https://t.co/0CFc4S0qCv 🎥 https://t.co/Z4hc7Q6cqM

Madrid, Comunidad de Madrid
Joined August 2012
Don't wanna be here? Send us removal request.
@sergiomzdev
Sergio Márquez Dev
8 hours
TD3 es clave para sistemas autónomos. Para la teoría, código PyTorch y aplicaciones reales en robótica/IA, lee la guía completa. 👇 ¿Tu mayor reto en RL? #IA #ML #RL #PyTorch #Robotica.
blog.sergiomarquez.dev
El control continuo es un desafío clave en el Aprendizaje por Refuerzo, especialmente para aplicaciones como la robótica y los vehículos autónomos, donde las acciones no son discretas sino que varían...
0
0
0
@sergiomzdev
Sergio Márquez Dev
8 hours
TD3 no es solo teoría. Se usa en robótica (brazos, humanoides), vehículos autónomos, control industrial y finanzas. Para optimizarlo: normaliza datos, usa buen ruido de exploración y ajusta hiperparámetros. ¡Clave para el éxito! ✨.
1
0
0
@sergiomzdev
Sergio Márquez Dev
8 hours
Implementar TD3 en PyTorch es más sencillo de lo que crees. Necesitas Actor, Crítico (doble), y Replay Buffer. El código es clave para entender cómo los 3 pilares de TD3 se traducen en un agente robusto. 💻.
1
0
0
@sergiomzdev
Sergio Márquez Dev
8 hours
Ahí entra TD3. Mejora DDPG con 3 claves: 1️⃣ Doble Crítico (evita sobreestimación). 2️⃣ Actualizaciones Retrasadas (más estabilidad). 3️⃣ Suavizado de Política Objetivo (más robustez). Esto lo hace ideal para control fino. 🦾.
1
0
0
@sergiomzdev
Sergio Márquez Dev
8 hours
El RL es brutal en juegos, pero en robótica o vehículos autónomos, las acciones son CONTINUAS. Q-Learning no sirve. DDPG intentó resolverlo, pero fallaba por inestabilidad y sobreestimación. ¿Cómo lo superamos? 👇.
1
0
0
@sergiomzdev
Sergio Márquez Dev
8 hours
Tu IA falla en robótica por esto. 🤖 La mayoría ignora el control continuo. Te muestro cómo TD3 en PyTorch lo resuelve, paso a paso. 🧵.
1
0
0
@sergiomzdev
Sergio Márquez Dev
1 day
Dominar la evaluación de LLMs es tan crucial como construirlos. Con LLM-as-a-Judge, DeepEval y Ragas, tus modelos serán robustos y fiables en producción. Aprende a implementarlo ya: ¿Qué métrica te preocupa más en tus LLMs?.
blog.sergiomarquez.dev
La evaluación de Modelos de Lenguaje de Gran Escala (LLMs) en entornos de producción es un desafío complejo que va más allá de las métricas tradicionales como BLEU o ROUGE. Este artículo profundiza...
0
0
0
@sergiomzdev
Sergio Márquez Dev
1 day
¿Cómo implementar esto? Con frameworks como DeepEval (unit testing para LLMs, tipo Pytest) y Ragas (específico para pipelines RAG). Integran evaluación continua en tu CI/CD. ¡Código y ejemplos en el blog!.
1
0
0
@sergiomzdev
Sergio Márquez Dev
1 day
Más allá del juez: métricas avanzadas. Para RAG, son vitales: Relevancia de Respuesta, Fidelidad (adiós alucinaciones), Precisión y Recuperación Contextual. Asegura que tu IA sea precisa y fiable. 📊.
1
0
0
@sergiomzdev
Sergio Márquez Dev
1 day
Solución: LLM-as-a-Judge. Usa un LLM 'juez' para evaluar a otro. Es escalable, consistente y capta matices (tono, alucinaciones). Ideal para QA automatizado. ¡Pero ojo con los sesgos y la dependencia del prompt!.
1
0
0
@sergiomzdev
Sergio Márquez Dev
1 day
Las métricas clásicas (BLEU, ROUGE) son limitadas en producción. ¿Por qué? No capturan la sutileza, relevancia o coherencia real de un LLM. Necesitas evaluación extrínseca, no solo intrínseca. Es clave para el éxito en apps reales.
1
0
0
@sergiomzdev
Sergio Márquez Dev
1 day
¿Evalúas tus LLMs con BLEU/ROUGE? 🚨 Error común. La mayoría de modelos en producción fallan por no ir más allá. Descubre cómo los ingenieros top evalúan LLMs en el mundo real y evitan desastres. Hilo 🧵.
1
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
Domina el despliegue de IA en el borde. La guía completa con código y mejores prácticas para TensorFlow Lite: #EdgeAI #TensorFlowLite #MLOps ¿Cuál es tu mayor desafío al desplegar modelos en dispositivos?.
blog.sergiomarquez.dev
Este artículo proporciona una guía completa para desarrolladores sobre cómo llevar modelos de IA/ML a la producción en dispositivos de borde utilizando TensorFlow Lite. Exploraremos la necesidad de...
0
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
No solo cuantifiques. Elige arquitecturas ligeras como MobileNet o EfficientNet Lite. Además, usa `Delegates` (GPU, NNAPI, Edge TPU) para acelerar la inferencia hasta 10x en hardware específico. ¡Crucial para rendimiento real!.
1
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
La clave para Edge AI: Cuantificación. Reduce modelos de FP32 a INT8/FP16. ¡Hasta 4x más pequeños y rápidos! Usa `tf.lite.Optimize.DEFAULT` y `representative_dataset` para INT8. Es el 80% de la optimización.
1
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
La IA en la nube es cara y lenta. ¿La solución? Edge AI. Pero desplegar modelos complejos en dispositivos limitados es el desafío. Aquí te revelo las técnicas que Google usa para optimizar modelos con TensorFlow Lite. 👇.
1
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
Si no estás optimizando tus modelos de IA para Edge en 2025, ya estás atrás. El 78% de los proyectos fallan por esto. Te muestro cómo evitarlo y dominar TensorFlow Lite 🧵.
1
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
La metodología completa para dominar los datos sintéticos y no quedarte atrás en la revolución de la IA: #AIDatosSinteticos #OptimizaciónIA ¿Estás listo para esta revolución o sigues con datos reales?.
blog.sergiomarquez.dev
La adquisición de datos reales es un cuello de botella costoso y lento para los proyectos de IA, plagado de problemas de privacidad y escasez. Sin embargo, los líderes de la industria están adoptando...
0
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
El futuro es sintético: Waabi y NVIDIA usan datos sintéticos en vehículos autónomos para billones de km de datos sin riesgo. Writer entrena LLMs más eficientes. Salud y finanzas blindan privacidad. ¡Esto ya es una realidad que ahorra millones y acelera la innovación!.
1
0
0
@sergiomzdev
Sergio Márquez Dev
7 days
2. Blindaje de Privacidad y Adiós al Sesgo: Entrena modelos con datos sensibles (salud, finanzas) sin exponer info real. ¡Cumple GDPR/HIPAA sin sudar! Además, crea datasets equilibrados para reducir sesgos y mejorar la equidad de tus modelos.
1
0
0