ObservabilityCON 2024: grandes notícias, atualizações de produtos e um novo programa de startups
Hoje, na ObservabilityCON 2024 em Nova York, apresentamos uma série de atualizações para simplificar a observabilidade, ajudar os usuários a economizar tempo e reduzir o trabalho, além de melhorar a eficiência geral e a relação custo-benefício por meio de novos recursos baseados em IA.
“As novidades apresentadas hoje representam um grande salto para tornar a observabilidade mais fácil, eficiente e inteligente”, disse Tom Wilkie, CTO da Grafana Labs. “Não estamos apenas melhorando nossas ferramentas, estamos mudando completamente a forma como as equipes de DevOps e os SREs interagem com seus sistemas e dados, simplificando suas atividades cotidianas."
Confira a palestra principal para saber mais e continue lendo para ver um resumo de todas as notícias da ObservabilityCON 2024.
Pacote de aplicativos Explore para uma experiência de usuário sem consulta
Um dos nossos maiores objetivos aqui na Grafana Labs é criar soluções de observabilidade que não sejam apenas poderosas, mas também acessíveis e fáceis de usar.
Hoje, estamos anunciando versões de prévia pública do Explore Traces e Explore Profiles. Eles se juntam ao Explore Metrics e Explore Logs, que já estão disponíveis para o público geral, para criar um conjunto completo de aplicativos Explore para Grafana e Grafana Cloud. Esses aplicativos simplificam a exploração e a análise de dados por meio de interfaces de usuário intuitivas e pontuais, permitindo que os usuários explorem e visualizem dados sem precisar conhecer linguagens de consulta como PromQL, LogQL ou TraceQL.
Para saber mais sobre os aplicativos Explore, confira nossa publicação no blog.
Fluxos de trabalho de análise de causa raiz contextualizados no Grafana Cloud
Desde a aquisição da Asserts.ai em 2023, temos trabalhado muito, integrando com o Grafana Cloud a tecnologia Asserts, que utiliza IA/ML para oferecer uma abordagem automatizada à correlação de anomalias. E, hoje, estamos muito animados para compartilhar os resultados desses esforços.
Estamos apresentando um conjunto de fluxos de trabalho unificados que conectam as soluções Asserts e Grafana Cloud para ajudar a automatizar a correlação de anomalias nas camadas de infraestrutura e aplicativos e fornecer uma experiência mais coesa de solução de problemas. Os fluxos de trabalho abrangem as mais variadas necessidades de monitoramento, incluindo desempenho de aplicativos, monitoramento de carga de trabalho do Kubernetes, monitoramento de infraestrutura, monitoramento de usuários reais e gerenciamento simplificado de SLO. Essas conclusões obtidas com a ajuda de IA permitem que até mesmo engenheiros juniores entendam e diagnostiquem de forma mais eficaz problemas em sistemas complexos.
Começamos a implementar esses novos recursos e, até 2 de outubro, todos os clientes do Grafana Cloud Advanced terão acesso ao Asserts e a esses fluxos de trabalho integrados no menu de navegação do Grafana Cloud. (Observação: será necessário ter o Kubernetes Monitoring no Grafana Cloud para executar o Asserts. Nosso sistema analisará automaticamente sua configuração e orientará você durante o processo de integração.)
Leia mais sobre esse novo conjunto de fluxos de trabalho unificados que conectam as soluções Asserts e Grafana Cloud na nossa publicação no blog.
Reduza custos com o conjunto cada vez maior de recursos de Telemetria Adaptativa
O Adaptive Logs, que hoje está disponível para o público geral em todos os níveis do Grafana Cloud, ajuda os usuários a reduzir seus custos de observabilidade através da redução do volume de logs desnecessários. Isso é feito através da identificação de padrões de logs frequentemente inseridos e da criação de um conjunto de recomendações de amostragem personalizadas com base na frequência com que esses padrões são consultados. Isso permite que você elimine logs de baixo valor e mantenha apenas os mais importantes.
O Adaptive Logs baseia-se no movimento das Métricas Adaptativas, que ajudaram os usuários a ter uma redução de 35% nos custos das métricas, em média. Tanto o Adaptive Logs quanto o Adaptive Metrics utilizam técnicas de IA/ML para analisar dados de observabilidade em uma escala que não seria viável com processos manuais. E estamos trabalhando para estender esse conceito também para os rastros.
Para acelerar o desenvolvimento do Adaptive Traces, temos o prazer de anunciar a aquisição da TailCtrl, uma empresa em estágio inicial fundada por Sean Porter, engenheiro e empresário experiente que havia co-fundado a Sensu. A experiência de Sean se alinha à nossa visão para o Adaptive Traces, que agora está em fase de pesquisa.
Para mais informações, confira nossas publicações no blog sobre o Adaptive Logs e a aquisição da TailCtrl.
Grafana Cloud potencializando a próxima geração de startups
Queremos ajudar mais organizações a começar a operar com observabilidade e é por isso que estamos lançando o Programa de Startups do Grafana Labs. A iniciativa oferece às startups elegíveis até US$ 100.000 em créditos do Grafana Cloud por 12 meses ou até a próxima rodada de financiamentos, com o objetivo de incentivar as startups a adotar as soluções de observabilidade escaláveis, de código aberto e combináveis do Grafana Labs desde o início, para que não fiquem presas a um fornecedor específico no futuro.
Os participantes receberão todos os produtos do Grafana Cloud, incluindo todos os plugins da versão Enterprise, o suporte do Grafana e acesso à equipe de desenvolvimento de negócios do Grafana Labs para integração do ecossistema. Buscamos startups com menos de US$ 10 milhões em financiamento e menos de 25 funcionários, mas podemos fazer exceções.
Se você tiver interesse em se inscrever, leia nossa publicação no blog sobre o Programa de Startups do Grafana Labs para obter mais informações.
Outros métodos que estamos usando para promover IA/ML na observabilidade
Os LLMs estão ganhando espaço no trabalho diários dos nossos usuários, por isso estamos desenvolvendo várias maneiras de monitorá-los e observá-los:
- Com a Nvidia como parceira de design, construímos uma ferramenta para rastrear experimentos de ML e comparar seus desempenhos traçando métricas de modelo (perda versus epoch, etc.) e monitorando registros de aplicativos em busca de falhas. A ferramenta de código aberto contém uma biblioteca Python para instrumentar o código de treinamento, um back-end escrito em Go para armazenar dados sobre execuções de treinamento e um plugin do Grafana para visualizar dados no Grafana.
- Estamos explorando diferentes maneiras de usar ferramentas de código aberto para monitorar LLMs, incluindo o OpenLIT SDK. O SDK produz rastros e métricas do OpenTelemetry para as chamadas de LLM, incluindo latência, custo e o número de tokens gerados. Essas métricas e rastros podem ser enviados para o Grafana Cloud e visualizados usando a solução de observabilidade de IA. O código de integração é de código aberto e está disponível no GitHub.
- Criamos o monitoramento de GPU usando o eBPF, que ajuda os desenvolvedores de IA a obter informações refinadas sobre suas cargas de trabalho sem instrumentação manual. No momento, esse recurso está disponível como um branch do projeto eBPF de código aberto da Grafana Labs, o Beyla.
Além de observar os LLMs, também estamos incorporando-os ao Grafana Cloud com Incident Rooms, que fornecem transcrição em tempo real para teleconferências sobre incidentes. Com esse recurso experimental, um bot transcreverá conversas diretamente em uma linha do tempo do incidente, usando LLMs para resumir e capturar insights críticos que, de outra forma, poderiam não ser percebidos.
Recursos de teste e monitoramento aprimorados no Grafana Cloud
Monitoramento sintético e teste de carregamento
No início deste ano, apresentamos uma versão nova do Grafana Cloud Synthetic Monitoring com tecnologia do Grafana k6 para permitir que os usuários simulem as transações e jornadas de usuário mais complexas. Hoje, anunciamos a unificação do Synthetic Monitoring e do k6, dando prioridade a facilitar a criação de testes com três novos recursos do Grafana Cloud:
- k6 Studio: uma ferramenta de criação de testes baseada em GUI e com pouco código que você pode usar para criar testes sem fazer scripts manuais em JavaScript. (Em teste)
- Monitoramento com script: realize um monitoramento black-box sintético de serviços usando JavaScript para simulações complexas da jornada do usuário, validações personalizadas e políticas flexíveis de repetição. (Prévia pública)
- Monitoramento do navegador: execute um navegador real e renderize toda a página da Web para obter métricas do Web Vital, capturas de tela e horários para validar a experiência completa do usuário do front-end. (Disponibilidade Geral no Grafana Cloud k6 e em breve no Synthetic Monitoring).
Monitoramento em várias nuvens com observabilidade do provedor de nuvem
O gerenciamento de ambientes com várias nuvens geralmente significa usar diferentes ferramentas de monitoramento para cada provedor, o que leva a um aumento da complexidade e da sobrecarga operacional. Para enfrentar esses desafios, anunciamos hoje que o Cloud Provider Observability, um aplicativo para monitorar os serviços da AWS, do Microsoft Azure e do Google Cloud, todos no Grafana Cloud, já está disponível para todos. O Cloud Provider Observability torna o monitoramento de várias nuvens mais simples e fornece insights mais abrangentes sobre vários serviços em nuvem com uma solução de observabilidade única e pronta para uso que é fácil de configurar e dimensionar.
Para ficar por dentro de todas as novidades mais recentes do ObservabilityCON 2024, siga o Grafana Labs no Twitter e no LinkedIn ou participe da Comunidade do Grafana Labs no Slack.