
Laysa 💻🎲🌈
@LayTXT
Followers
9K
Following
4K
Media
1K
Statuses
9K
Data Engineer & Machine Learning | Electrical Engineer
Joined September 2020
Vocês que tão começando a fazer projetinhos em BI pra estudos e tal, se ficarem em dúvida sobre quais cores utilizar pra fazer combinações que não agridam os olhos podem utilizar essa ferramenta de roda de cores da Adobe. Ela mostra as melhores combinações de cores e tons.
6
24
484
Aos poucos respondendo todas as DMs, faltam 8. Demora um pouco, mas procuro responder todo mundo e é cada textão que eu mando, já peço desculpas antecipadamente. :P.
1
0
21
Tava lendo um artigo de sensores e arquitetura e me veio um pensamento que nós da Engenharia de Dados fazemos acontecer no mundinho cloud, mas quando o assunto é IoT quase ninguém entende da coleta de dados, armazenamento e tratamento dessas informações.
6
0
79
Qualquer coisinha que acontece o Oracle:._ Ai não posso porque estão me onerando.😩😭😖
0
0
13
Bora, pessoal! Hoje tem mais aula de Aprendizado por Reforço. Sigam o data icmc no Inst pra acompanharem as notícias de cursos e também olhem o YT deles, pois está tudo disponível lá.
0
3
89
Fui olhar minha estatística no Spotify dos últimos meses, sou muito influenciada por esse blog a conhecer músicas e bandas novas, também ouvir coisas antigas e listas dos melhores álbuns nacionais e internacionais.
0
0
14
Hoje fiz a prova de 99 questões de Engenharia de Dados da HackerRank. Múltipla escolha, duas horas de prova e pouco. Os tópicos mais complexos:.-Otimização e descrição de aplicações .-Tratamentos de Json e erros.-Consumo de APIs.-Data Quality.-Jobs e Workflows Databricks.-Analise.
3
4
275
Tô em êxtase, fui promovida. Agora o foco é em Tech Lead de Engenharia de Dados.
65
5
2K
Se você quiser gerar projetinhos de token, recomendo usar o Llama 4 da Meta (ou o 3,1). Ele é gratuito com algumas limitações e você pode achar ótimos conteúdos que te ensinar a elaborar algo. Mas lembre-se, você está alimentando a Meta, então veja bem o que vai colocar nesse
0
0
4
Como um outro exemplo disso, até 2024 o custo de processamento por token no GPT-4 estava em torno de U$3,75 por 1 milhão de entradas e U$15 por 1 milhão de saída. Assim o custo pro negócio pode ser previsível ao projeto. Só seu Word, 1 milhão de palavras está em torno de 650.
1
0
2
Agora vamos mudar nosso olhar pro contexto negócio e operações. - Custo: Os modelos de IA calculam os custos com base na quantidade de tokens processados. Isso facilita a gestão do orçamento e evitando despesas inesperadas. - Eficiência Operacional: Tokenização possibilita
1
0
1
- Com tokens, o modelo pode combinar o melhor dos dois mundos. A palavra “intelligence” pode ser dividida em dois tokens: “intel” e “ligence.” Isso permite ao modelo reconhecer padrões comuns em partes da palavra, o que é útil para entender melhor palavras novas. Ao mesmo tempo,
1
0
1
Mais um exemplo clássico:.No texto “Understanding artificial intelligence.”. - Para um modelo de IA processar o texto usando caracteres, ele dividiria a frase em 33 caracteres individuais, incluindo espaços. A ineficiência seria alta para os objetivos da IA, pois o modelo.
1
0
1
O motivo de uso de Token em vez de caracteres ou palavras porque os Tokens permitem uma segmentação mais granular do texto, facilitando o processamento e a análise. Essa granularidade ajuda o modelo a lidar com a diversidade linguística, reduzindo erros e melhorando a precisão.
1
0
1
Então agora argumentando de forma técnica, o Token é um fragmento textual, que ao ser processado pode representar palavras inteiras, partes ou caracteres individuais. O exemplo mais clássico na frase “inteligência artificial”, o modelo pode dividir o texto em três tokens:
1
0
1
Tokens são as unidades básicas processadas por modelos de linguagem. E desenvolver projetos com essa utilização deixa mais claro o impacto nas operações corporativas. Exemplo, num projeto que há desenvolvido, se monitora a quantidade de tokens consumidos durante a análise de
1
0
2