aastroza Profile Banner
Alonso Astroza 🤖 Profile
Alonso Astroza 🤖

@aastroza

Followers
1K
Following
11K
Media
433
Statuses
12K

Senior Data Scientist @DataScienceUDD. Machine Learning Consultant @GeoVictoriaCL. mrhadoken @MTG_Arena. I love my wife @CsolangeS. We have three cats 🐈

Santiago, Chile
Joined June 2009
Don't wanna be here? Send us removal request.
@aastroza
Alonso Astroza 🤖
1 year
Excited to share this fantastic blog post! I’m honored to have been part of this story. The results are outstanding. Check it out and see how we achieved our community goal
@dottxtai
.txt
1 year
Open models available TODAY can beat GPT-4 using structured generation 👇 While we are proud of this achievement, we wanted to talk about the communities and projects that made this possible 🧑‍🤝‍🧑 The reasons why, eventually, Open Source shall prevail 📖 https://t.co/PlD1JOpFUS
1
11
31
@alonsosilva
Alonso Silva
4 days
Acompáñame este domingo a las 17h30 (hora de Chile) donde daré una charla sobre cómo extraer información estructurada a partir de datos no estructurados usando modelos de lenguaje 😊
@pythonchiledev
Python Chile
4 days
💡Respuestas y generación estructurada en LLMs Alonso Silva muestra cómo combinar técnicas para extraer datos precisos de información no estructurada. 📅9/11 |🕠17:30 – 18:00 | Online Nivel intermedio | Datos 🎥Transmisión por https://t.co/EKqZDq9MvF #PyConChile2025 #PythonChile
0
1
7
@aastroza
Alonso Astroza 🤖
15 days
¿Qué tan mal transcriben el español chileno los modelos de voz a texto actuales? Spoiler: peor de lo que creíamos. Me propuse medirlo con un nuevo leaderboard de ASR enfocado exclusivamente en español chileno. 🧵👇
1
4
5
@OmarUFlorez
Omar U. Florez 🇵🇪🇺🇸
19 days
Here are the slides from my 3-hour lecture at the Deep Learning Spring School on "Efficient Pre-Training of LLMs" held in Buenos Aires, Argentina 🇦🇷 ( https://t.co/kVJpli74Af) The talk included some of the key findings we are encountering while building #LatamGPT: • Neural
1
2
24
@aastroza
Alonso Astroza 🤖
15 days
Acabo de agregar al leaderboard el finetune español latam de whisper-large-v3-turbo hecho por @surusdev . Además descubrí que tienen una comunidad especializada en construir benchmarks para llms con foco en task especializadas para Latinoamérica. ¡Recomiendo seguir su trabajo!
@aastroza
Alonso Astroza 🤖
15 days
¿Qué tan mal transcriben el español chileno los modelos de voz a texto actuales? Spoiler: peor de lo que creíamos. Me propuse medirlo con un nuevo leaderboard de ASR enfocado exclusivamente en español chileno. 🧵👇
1
2
3
@mariano_basti
Marian Basti
15 days
@aastroza Genial esto! También estoy trabajando con enfoque en datos de LatAm. Que pocos hay que estén ordenados y filtrados. Hace no mucho hicimos un fine-tune de whisper para audios de LatAm (filtrando Common Voice también) Sería interesante ver cómo le va! https://t.co/rXSG20Iidl
huggingface.co
1
1
1
@aastroza
Alonso Astroza 🤖
15 days
Gracias a @HuggingFace por el ASR Leaderboard original, que sirvió como base e inspiración para adaptar la evaluación al español chileno 🇨🇱 Y gracias a @modal_labs por los créditos de cómputo en la nube y la documentación impecable que hizo posible correr todas las evaluaciones.
0
0
1
@aastroza
Alonso Astroza 🤖
15 days
Si te interesa: - apoyar con datos. - aportar compute. - financiar el entrenamiento. - o simplemente conversar del proyecto. ¡Escríbeme! Gracias por leer. ¡Compartir ayuda mucho!
2
0
2
@aastroza
Alonso Astroza 🤖
15 days
Próximo paso: entrenar un modelo ASR optimizado para español chileno. Los modelos actuales están bajo el ~80% de precisión en condiciones naturales. Queremos subir eso mucho y liberar el modelo de forma abierta para investigación, industria y comunidad.
1
0
0
@aastroza
Alonso Astroza 🤖
15 days
Además liberamos un dataset de prueba, con tres fuentes distintas de habla chilena real: • Common Voice (filtrado por dialecto) • Google Chilean Spanish • Festival de Viña (Datarisas) https://t.co/H9qi1hKyb1 Todo abierto, libre y documentado. ¡Y en constante crecimiento!
Tweet card summary image
huggingface.co
1
0
1
@aastroza
Alonso Astroza 🤖
15 days
No es chiste. Si no hablas chileno, cuesta dimensionar lo mal que están los modelos para nuestra forma de hablar. Y eso importa mucho, porque afecta: - La accesibilidad. - La educación. - A las herramientas para medios de comunicación o generadores de contenido.
1
0
0
@aastroza
Alonso Astroza 🤖
15 days
Pero evaluar solo con frases neutrales no basta. El español chileno de verdad está en la calle, en la micro, en el carrete, en las tallas. Por eso incluimos Datarisas, un dataset de segmentos de humor del Festival de Viña 🥲 Y sí, a los modelos les fue terrible 😂
1
0
0
@aastroza
Alonso Astroza 🤖
15 days
Creé el "Open ASR Leaderboard - Chilean Spanish" para evaluar modelos solo en español chileno hablado real. Probamos 9 modelos modernos y comparamos precisión (WER) y velocidad (RTFx). Todo abierto y reproducible:
Tweet card summary image
huggingface.co
1
0
2
@aastroza
Alonso Astroza 🤖
15 days
La mayoría de modelos como Whisper, Canary o ElevenLabs dicen “soportar español”, pero… terminan transcribiendo como argentino, mexicano o un español neutro genérico. Para quienes hablamos chileno, eso es super fome y se nota al tiro.
1
0
0
@aastroza
Alonso Astroza 🤖
15 days
¿Qué tan mal transcriben el español chileno los modelos de voz a texto actuales? Spoiler: peor de lo que creíamos. Me propuse medirlo con un nuevo leaderboard de ASR enfocado exclusivamente en español chileno. 🧵👇
1
4
5
@fforres
fforres
16 days
There's still ~24 hours left 🔥 But here's a summary of the first day of the hackathon we're running with @skyward_ai There's like 150 people in there and they are killin' it! (A team works on an asteroid detection model)
1
3
6
@fforres
fforres
20 days
And so it took us less than a month to organize it! 🔥 200+ curated folks, $60K US in total prizes, $10K cash, 36 hours of hacking focused purely on Agentic AI. https://t.co/luCWh9XYEM It's going to be amazing!! and it is only possible thanks to our parters & sponsors
@fforres
fforres
2 months
I don’t post much about this, but I’m hosting a hackathon in Chile ~1 month out. I'm angry at companies doing AI hype events that exploit devs, students & researchers with shady IP grabs. I know we can do better, so I’m funding a builder-first version Last year, we did a great
1
6
15
@CommunityOS_
CommunityOS
1 month
#TheAgentHackathon en #Chile. 📍24–25 de octubre 2025 en @hubprovidencia. 🗓️ hasta el 14/10/2025. 👾 Por @skyward_ai , con el apoyo de @ElevenLabsDevs , @elevenlabsio , @continuumhq , @hubprovidencia 👉 https://t.co/5mTLef4vn9
0
10
10
@pierre_vannier
Pierre Vannier
1 month
Hey @simonw I proposed the term « vibe engineering » here in march and asked you and @karpathy about it. That could be cool to mention that in your post on your blog and / or on X… It could make sense that the idea made its way in your thoughts but… I think I proposed it first
simonwillison.net
I feel like vibe coding is pretty well established now as covering the fast, loose and irresponsible way of building software with AI—entirely prompt-driven, and with no attention paid to …
@pierre_vannier
Pierre Vannier
8 months
I propose the term "Vibe engineering" over "Vibe coding" @karpathy @simonw are you ok with that?
0
2
7
@CommunityOS_
CommunityOS
1 month
🚀 #TheAgentHackathon! 📍 24–25 octubre · @hubprovidencia 💰 ~ 10K USD a repartir 🗓️ Hasta el 14 de octubre 👉 https://t.co/1v3IBHewIs 👾 Por @skyward_ai, con el apoyo de @ElevenLabsDevs @elevenlabsio. #AgenticAI #Builders #chile #InnovaciónTecnológica #HackathonChile
1
6
13