Alonso Astroza 🤖
@aastroza
Followers
1K
Following
11K
Media
433
Statuses
12K
Senior Data Scientist @DataScienceUDD. Machine Learning Consultant @GeoVictoriaCL. mrhadoken @MTG_Arena. I love my wife @CsolangeS. We have three cats 🐈
Santiago, Chile
Joined June 2009
Excited to share this fantastic blog post! I’m honored to have been part of this story. The results are outstanding. Check it out and see how we achieved our community goal
Open models available TODAY can beat GPT-4 using structured generation 👇 While we are proud of this achievement, we wanted to talk about the communities and projects that made this possible 🧑🤝🧑 The reasons why, eventually, Open Source shall prevail 📖 https://t.co/PlD1JOpFUS
1
11
31
Acompáñame este domingo a las 17h30 (hora de Chile) donde daré una charla sobre cómo extraer información estructurada a partir de datos no estructurados usando modelos de lenguaje 😊
💡Respuestas y generación estructurada en LLMs Alonso Silva muestra cómo combinar técnicas para extraer datos precisos de información no estructurada. 📅9/11 |🕠17:30 – 18:00 | Online Nivel intermedio | Datos 🎥Transmisión por https://t.co/EKqZDq9MvF
#PyConChile2025 #PythonChile
0
1
7
¿Qué tan mal transcriben el español chileno los modelos de voz a texto actuales? Spoiler: peor de lo que creíamos. Me propuse medirlo con un nuevo leaderboard de ASR enfocado exclusivamente en español chileno. 🧵👇
1
4
5
Here are the slides from my 3-hour lecture at the Deep Learning Spring School on "Efficient Pre-Training of LLMs" held in Buenos Aires, Argentina 🇦🇷 ( https://t.co/kVJpli74Af) The talk included some of the key findings we are encountering while building #LatamGPT: • Neural
1
2
24
Acabo de agregar al leaderboard el finetune español latam de whisper-large-v3-turbo hecho por @surusdev . Además descubrí que tienen una comunidad especializada en construir benchmarks para llms con foco en task especializadas para Latinoamérica. ¡Recomiendo seguir su trabajo!
¿Qué tan mal transcriben el español chileno los modelos de voz a texto actuales? Spoiler: peor de lo que creíamos. Me propuse medirlo con un nuevo leaderboard de ASR enfocado exclusivamente en español chileno. 🧵👇
1
2
3
@aastroza Genial esto! También estoy trabajando con enfoque en datos de LatAm. Que pocos hay que estén ordenados y filtrados. Hace no mucho hicimos un fine-tune de whisper para audios de LatAm (filtrando Common Voice también) Sería interesante ver cómo le va! https://t.co/rXSG20Iidl
huggingface.co
1
1
1
Gracias a @HuggingFace por el ASR Leaderboard original, que sirvió como base e inspiración para adaptar la evaluación al español chileno 🇨🇱 Y gracias a @modal_labs por los créditos de cómputo en la nube y la documentación impecable que hizo posible correr todas las evaluaciones.
0
0
1
Si te interesa: - apoyar con datos. - aportar compute. - financiar el entrenamiento. - o simplemente conversar del proyecto. ¡Escríbeme! Gracias por leer. ¡Compartir ayuda mucho!
2
0
2
Próximo paso: entrenar un modelo ASR optimizado para español chileno. Los modelos actuales están bajo el ~80% de precisión en condiciones naturales. Queremos subir eso mucho y liberar el modelo de forma abierta para investigación, industria y comunidad.
1
0
0
Además liberamos un dataset de prueba, con tres fuentes distintas de habla chilena real: • Common Voice (filtrado por dialecto) • Google Chilean Spanish • Festival de Viña (Datarisas) https://t.co/H9qi1hKyb1 Todo abierto, libre y documentado. ¡Y en constante crecimiento!
huggingface.co
1
0
1
No es chiste. Si no hablas chileno, cuesta dimensionar lo mal que están los modelos para nuestra forma de hablar. Y eso importa mucho, porque afecta: - La accesibilidad. - La educación. - A las herramientas para medios de comunicación o generadores de contenido.
1
0
0
Pero evaluar solo con frases neutrales no basta. El español chileno de verdad está en la calle, en la micro, en el carrete, en las tallas. Por eso incluimos Datarisas, un dataset de segmentos de humor del Festival de Viña 🥲 Y sí, a los modelos les fue terrible 😂
1
0
0
Creé el "Open ASR Leaderboard - Chilean Spanish" para evaluar modelos solo en español chileno hablado real. Probamos 9 modelos modernos y comparamos precisión (WER) y velocidad (RTFx). Todo abierto y reproducible:
huggingface.co
1
0
2
La mayoría de modelos como Whisper, Canary o ElevenLabs dicen “soportar español”, pero… terminan transcribiendo como argentino, mexicano o un español neutro genérico. Para quienes hablamos chileno, eso es super fome y se nota al tiro.
1
0
0
¿Qué tan mal transcriben el español chileno los modelos de voz a texto actuales? Spoiler: peor de lo que creíamos. Me propuse medirlo con un nuevo leaderboard de ASR enfocado exclusivamente en español chileno. 🧵👇
1
4
5
There's still ~24 hours left 🔥 But here's a summary of the first day of the hackathon we're running with @skyward_ai There's like 150 people in there and they are killin' it! (A team works on an asteroid detection model)
1
3
6
And so it took us less than a month to organize it! 🔥 200+ curated folks, $60K US in total prizes, $10K cash, 36 hours of hacking focused purely on Agentic AI. https://t.co/luCWh9XYEM It's going to be amazing!! and it is only possible thanks to our parters & sponsors
I don’t post much about this, but I’m hosting a hackathon in Chile ~1 month out. I'm angry at companies doing AI hype events that exploit devs, students & researchers with shady IP grabs. I know we can do better, so I’m funding a builder-first version Last year, we did a great
1
6
15
#TheAgentHackathon en #Chile. 📍24–25 de octubre 2025 en @hubprovidencia. 🗓️ hasta el 14/10/2025. 👾 Por @skyward_ai , con el apoyo de @ElevenLabsDevs , @elevenlabsio , @continuumhq , @hubprovidencia 👉 https://t.co/5mTLef4vn9
0
10
10
Hey @simonw I proposed the term « vibe engineering » here in march and asked you and @karpathy about it. That could be cool to mention that in your post on your blog and / or on X… It could make sense that the idea made its way in your thoughts but… I think I proposed it first
simonwillison.net
I feel like vibe coding is pretty well established now as covering the fast, loose and irresponsible way of building software with AI—entirely prompt-driven, and with no attention paid to …
0
2
7
🚀 #TheAgentHackathon! 📍 24–25 octubre · @hubprovidencia 💰 ~ 10K USD a repartir 🗓️ Hasta el 14 de octubre 👉 https://t.co/1v3IBHewIs 👾 Por @skyward_ai, con el apoyo de @ElevenLabsDevs @elevenlabsio. #AgenticAI #Builders #chile #InnovaciónTecnológica #HackathonChile
1
6
13