{"id":628,"date":"2024-09-18T14:14:06","date_gmt":"2024-09-18T14:14:06","guid":{"rendered":"https:\/\/new1tech.net\/?p=628"},"modified":"2025-08-10T19:32:09","modified_gmt":"2025-08-10T19:32:09","slug":"sre","status":"publish","type":"post","link":"https:\/\/new1tech.net\/pt\/sre\/","title":{"rendered":"SRE Postmortem: Aprendendo com o fracasso\u00a0(incidentes)"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-post\" data-elementor-id=\"628\" class=\"elementor elementor-628\">\n\t\t\t\t<div class=\"has_eae_slider elementor-element elementor-element-84da0b7 e-flex e-con-boxed e-con e-parent\" data-eae-slider=\"27211\" data-id=\"84da0b7\" data-element_type=\"container\" data-e-type=\"container\" data-settings=\"{&quot;background_background&quot;:&quot;classic&quot;,&quot;tj-animation&quot;:&quot;none&quot;}\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t<div class=\"has_eae_slider elementor-element elementor-element-cb4978a e-flex e-con-boxed e-con e-parent\" data-eae-slider=\"53805\" data-id=\"cb4978a\" data-element_type=\"container\" data-e-type=\"container\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t<div class=\"has_eae_slider elementor-element elementor-element-451d75e e-con-full e-flex e-con e-child\" data-eae-slider=\"38935\" data-id=\"451d75e\" data-element_type=\"container\" data-e-type=\"container\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\">\n\t\t\t\t<div class=\"elementor-element elementor-element-a51e4ae elementor-widget elementor-widget-text-editor\" data-id=\"a51e4ae\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>No setor de enterprise IT, muitas organiza\u00e7\u00f5es discutem a ado\u00e7\u00e3o da transforma\u00e7\u00e3o digital. No entanto, parece que elas se concentram maioritariamente no lado mais agrad\u00e1vel, os \u201cmomentos de paz\u201d, deixando de lado os per\u00edodos de crise, ou seja, os incidentes. Sim, incidentes, comportamentos inesperados ocorrer\u00e3o com seu servi\u00e7o ou plataforma. Voc\u00ea possui um processo de resposta a incidentes ou um runbook? O foco deste post \u00e9 no ritual p\u00f3s-incidente, e n\u00e3o exclusivamente na resposta a incidentes (incident response), tema que abordaremos em um futuro post.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-0cff449 elementor-widget elementor-widget-text-editor\" data-id=\"0cff449\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Aqui, mais uma vez, vou ressaltar a import\u00e2ncia da cultura SRE e como \u00e9 comum que organiza\u00e7\u00f5es que n\u00e3o adotaram essa cultura enfrentem incidentes similares ou id\u00eanticos repetidamente. Mesmo assim, eventos como esses n\u00e3o conduzem a uma investiga\u00e7\u00e3o aprofundada, abrindo espa\u00e7o para mais perdas de receita e danos \u00e0 reputa\u00e7\u00e3o da organiza\u00e7\u00e3o em uma era digital na qual a experi\u00eancia do cliente (CX) e qualidades como disponibilidade se tornam diferenciais cruciais na escolha de um servi\u00e7o pelos clientes.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-b664cd3 elementor-widget elementor-widget-elementskit-heading\" data-id=\"b664cd3\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">Hello Postmortem<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-28b4ba7 elementor-widget elementor-widget-text-editor\" data-id=\"28b4ba7\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>\u201cPostmortem (an\u00e1lise de p\u00f3s-incidente) \u00e9 um relat\u00f3rio\/registro escrito de um incidente, desde a detec\u00e7\u00e3o, seu impacto, as a\u00e7\u00f5es tomadas para mitigar ou resolver o problema, as root causes(s) e as a\u00e7\u00f5es de acompanhamento para evitar a recorr\u00eancia do incidente\u201d. \u2013\u00a0<strong>Google<\/strong><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-2ef30f3 elementor-widget elementor-widget-elementskit-heading\" data-id=\"2ef30f3\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">SRE no seu melhor #interrup\u00e7\u00f5es #an\u00e1lisedep\u00f3sincidente<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-ca2d969 elementor-widget elementor-widget-text-editor\" data-id=\"ca2d969\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Uma das diferen\u00e7as entre a mentalidade\/filosofia SRE em compara\u00e7\u00e3o com outras mentalidades operacionais come\u00e7a aqui.\u00a0<img decoding=\"async\" class=\"emoji\" role=\"img\" draggable=\"false\" src=\"https:\/\/s0.wp.com\/wp-content\/mu-plugins\/wpcom-smileys\/twemoji\/2\/svg\/1f609.svg\" alt=\"\ud83d\ude09\" \/><br \/><strong>Preencher um documento com An\u00e1lise de Causa Raiz root cause analise (RCA) n\u00e3o pode ser o \u00fanico foco p\u00f3s-incidente. \u201cO custo do fracasso \u00e9 a educa\u00e7\u00e3o.\u201d<\/strong><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-1aad7f5 elementor-widget elementor-widget-text-editor\" data-id=\"1aad7f5\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Em outra linguagem, no mundo SRE, nenhum incidente \u00e9 realmente dado como resolvido\/encerrado sem um postmortem. POR QU\u00ca? Porque os incidentes s\u00e3o oportunidades inestim\u00e1veis de aprendizado, e postmortem garantem essa aprendizagem com falhas e ajudam a identificar e corrigir fraquezas\u2026<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-79075db elementor-widget elementor-widget-text-editor\" data-id=\"79075db\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Elaborar uma an\u00e1lise p\u00f3s-incidente pode parecer uma tarefa exaustiva, intimidadora e at\u00e9 mesmo assustadora. No entanto, voc\u00ea se surpreender\u00e1 com os insights que ganhar\u00e1 sobre seus processos e as vulnerabilidades do sistema que ser\u00e3o reveladas durante este exerc\u00edcio.<em>\u00a0\u00c9 importante salientar que realizar um postmortem s\u00f3 vale a pena se ele trouxer valor agregado; caso contr\u00e1rio, ser\u00e1 tempo desperdi\u00e7ado.<\/em><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-889f754 elementor-widget elementor-widget-elementskit-heading\" data-id=\"889f754\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">Cultura<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-19f3a90 elementor-widget elementor-widget-text-editor\" data-id=\"19f3a90\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Adotar mindset Confiabilidade\/Postmortem vai al\u00e9m de apenas focar nos sintomas e restabelecer a operacionalidade do servi\u00e7o; \u00e9 essencial tratar as causas subjacentes do problema. Tomemos um exemplo simples, algo aparentemente trivial como uma paralisa\u00e7\u00e3o causada por falta de espa\u00e7o em uma parti\u00e7\u00e3o ou mount point espec\u00edfico. Ap\u00f3s resolver o incidente, n\u00e3o basta apenas registrar num documento\u00a0<em>RCA<\/em>\u00a0que a parti\u00e7\u00e3o estava cheia e que foi realizado um processo de limpeza, e o\u00a0<em>service\u00a0<\/em>restabelicido. Como medida preventiva, vamos implementar uma rotina de limpeza\u2026<\/p>\n<p>Nestes moldes, \u00e9 dif\u00edcil perceber exatamente o que deu errado ou falhou para provocar um incidente, incluindo o tempo necess\u00e1rio para a implementa\u00e7\u00e3o da rotina de limpeza e a identifica\u00e7\u00e3o da pessoa respons\u00e1vel por essa tarefa. Relativamente ao incidente em si, podemos supor que um aumento repentino no volume de logs pode ter sido causado por um acr\u00e9scimo no n\u00famero de erros registrados, um aumento no n\u00edvel de detalhe dos logs\u00a0<em>debug<\/em>\u00a0(verbosity) ou no n\u00famero de transa\u00e7\u00f5es. Estas s\u00e3o hip\u00f3teses que deveriam ser facilmente esclarecidas se houvesse um monitoramento\/observabilidade b\u00e1sico e eficaz do n\u00famero de transa\u00e7\u00f5es e erros por exemplo. Antes mesmo de avan\u00e7armos para\u00a0<em>observability<\/em>\u00a0ou RED monitoring, surge a quest\u00e3o: o que aconteceu com o monitoramento do espa\u00e7o dispon\u00edvel nos discos?\u00a0<img decoding=\"async\" class=\"emoji\" role=\"img\" draggable=\"false\" src=\"https:\/\/s0.wp.com\/wp-content\/mu-plugins\/wpcom-smileys\/twemoji\/2\/svg\/1f632.svg\" alt=\"\ud83d\ude32\" \/>\u00a0<\/p>\n<p>Antes de apresentar um modelo de quest\u00f5es para postmortem, \u00e9 importante lembrar que para este processo ser verdadeiramente valioso (promovendo aprendizado cont\u00ednuo) e n\u00e3o se basear em opini\u00f5es, distor\u00e7\u00f5es ou oculta\u00e7\u00e3o de dados e fatos, \u00e9 essencial que a organiza\u00e7\u00e3o j\u00e1 tenha cultura de psychological safety (um ambiente de seguran\u00e7a psicol\u00f3gica). Isto implica adotar uma cultura generativa, onde o foco n\u00e3o esteja em atribuir culpas. Os t\u00e9cnicos devem sentir-se seguros para compartilhar todos os detalhes necess\u00e1rios sem o receio de puni\u00e7\u00e3o, garantindo assim a transpar\u00eancia e a efic\u00e1cia do processo.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-f27e834 elementor-widget elementor-widget-elementskit-heading\" data-id=\"f27e834\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">Template\/Quest\u00f5es<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-ed8a870 elementor-widget elementor-widget-text-editor\" data-id=\"ed8a870\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p><strong>Detec\u00e7\u00e3o<\/strong><br \/>Como o incidente foi detectado? Desafio voc\u00ea a responder:\u00a0<img decoding=\"async\" class=\"emoji\" role=\"img\" draggable=\"false\" src=\"https:\/\/s0.wp.com\/wp-content\/mu-plugins\/wpcom-smileys\/twemoji\/2\/svg\/1f642.svg\" alt=\"\ud83d\ude42\" \/><strong>\u00a0reportado pelo end user<\/strong>, pois n\u00e3o conseguiam realizar pesquisas, etc\u2026 Devemos evitar ao m\u00e1ximo os cen\u00e1rios em que \u00e9 o usu\u00e1rio quem nos informa sobre outages ou instabilidades no nosso servi\u00e7o.<br \/>Se mais de tr\u00eas interrup\u00e7\u00f5es n\u00e3o foram inicialmente detectadas nem por nossas ferramentas nem pelos engenheiros,\u00a0<img decoding=\"async\" class=\"emoji\" role=\"img\" draggable=\"false\" src=\"https:\/\/s0.wp.com\/wp-content\/mu-plugins\/wpcom-smileys\/twemoji\/2\/svg\/1f626.svg\" alt=\"\ud83d\ude26\" \/>\u00a0\u00e9 evidente um erro 404: Pr\u00e1ticas de SRE N\u00e3o Encontradas aqui.<br \/><em><strong>Tempo e esfor\u00e7o devem ser aplicados para melhorar e obter uma vis\u00e3o clara da experi\u00eancia do usu\u00e1rio em nosso servi\u00e7o.<\/strong><\/em><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-168b83a elementor-widget elementor-widget-text-editor\" data-id=\"168b83a\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p><strong>Recorr\u00eancia<\/strong><br \/>Esse incidente (com mesmo RCA) ocorreu antes? Se sim, por que aconteceu novamente?<br \/>Desafio voc\u00ea a responder SIM, o mesmo aconteceu, incidentes INC-757 &amp; INC-828. Corre\u00e7\u00e3o ainda a ser implementada\u2026<br \/><strong><em>\u00c9 cen\u00e1rio indesej\u00e1vel; a mentalidade SRE visa evitar que um erro ocorra mais de uma vez, o que tamb\u00e9m justifica nossa \u00eanfase em aprender com as falhas.<\/em><\/strong><\/p>\n<p><strong>Backlog<\/strong><br \/>Alguma tarefa em nosso backlog poderia ter prevenido o incidente ou reduzido significativamente\u00a0<em>blast radius<\/em>\u00a0impacto? Se sim, por que n\u00e3o foi feito?<br \/><strong><em>\u00c9 comum que, ap\u00f3s um postmortem, sejam gerados itens de a\u00e7\u00e3o para corrigir e aprimorar os pontos fracos identificados. \u00c9 essencial que esses itens de a\u00e7\u00e3o estejam devidamente registrados, atribu\u00eddos e com alta prioridade, al\u00e9m de possu\u00edrem prazos claros de conclus\u00e3o. Trata-se de um trabalho que agrega valor ao servi\u00e7o e contribui para melhorar sua confiabilidade<\/em><\/strong>.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-440a8d6 elementor-widget elementor-widget-elementskit-heading\" data-id=\"440a8d6\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">RCA (irei colar o examplo do postmortem do gitlab)<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-7f37e51 elementor-widget elementor-widget-elementskit-heading\" data-id=\"7f37e51\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">Resumindo, simples postmortem deve conter pelo menos:<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-18a5b04 elementor-widget elementor-widget-text-editor\" data-id=\"18a5b04\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<ul class=\"wp-block-list\">\n<li>Detalhes sobre a descoberta do incidente<\/li>\n<li>Linha do tempo (a cronologia \u00e9 importante)<\/li>\n<li>Respostas aos 5 porqu\u00eas(5 whys), uma t\u00e9cnica de questionamento iterativo<\/li>\n<li>Maneiras de prevenir o incidente<\/li>\n<li>Registro de Incidentes relacionados<\/li>\n<li>Li\u00e7\u00e3o aprendida e itens de a\u00e7\u00e3o claros com timelines<\/li>\n<li>Qualquer informa\u00e7\u00e3o de apoio<\/li>\n<\/ul>\n<p>Nota: \u00c9 recomend\u00e1vel que o postmortem seja realizado dentro de um per\u00edodo de 24 a 72 horas ap\u00f3s o incidente, enquanto as informa\u00e7\u00f5es ainda est\u00e3o frescas na mem\u00f3ria de todos.<\/p>\n<p><strong>Exemplos de postmortem:<\/strong><br \/><a href=\"https:\/\/www.elastic.co\/blog\/elastic-cloud-incident-report-feburary-4-2019\" rel=\"nofollow\">https:\/\/www.elastic.co\/blog\/elastic-cloud-incident-report-feburary-4-2019<\/a><br \/><a href=\"https:\/\/about.gitlab.com\/blog\/2017\/02\/10\/postmortem-of-database-outage-of-january-31\/\" rel=\"nofollow\">https:\/\/about.gitlab.com\/blog\/2017\/02\/10\/postmortem-of-database-outage-of-january-31\/<\/a><br \/><a href=\"https:\/\/github.com\/dastergon\/post-mortems\">https:\/\/github.com\/dastergon\/post-mortems<\/a><br \/><a href=\"https:\/\/www.atlassian.com\/incident-management\/postmortem\/templates#incident-summary\">https:\/\/www.atlassian.com\/incident-management\/postmortem\/templates#incident-summary<\/a><\/p>\n<p><strong>Templates<\/strong><br \/><a href=\"https:\/\/github.com\/dastergon\/postmortem-templates\/blob\/master\/templates\/postmortem-template-srebook.md\" rel=\"nofollow\">https:\/\/github.com\/dastergon\/postmortem-templates\/blob\/master\/templates\/postmortem-template-srebook.md<\/a><br \/><a href=\"https:\/\/github.com\/dastergon\/postmortem-templates\">https:\/\/github.com\/dastergon\/postmortem-templates<\/a><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-cfe3269 elementor-widget elementor-widget-elementskit-heading\" data-id=\"cfe3269\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"elementskit-heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"ekit-wid-con\" ><div class=\"ekit-heading elementskit-section-title-wraper text_center   ekit_heading_tablet-   ekit_heading_mobile-\"><h2 class=\"ekit-heading--title elementskit-section-title \">Wrap up<\/h2><\/div><\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-19c14b2 elementor-widget elementor-widget-text-editor\" data-id=\"19c14b2\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Mais perguntas como essas podem definitivamente auxiliar na sua jornada rumo \u00e0 maior confiabilidade. N\u00e3o faz sentido identificar dados e padr\u00f5es que comprometem a confiabilidade e simplesmente ignor\u00e1-los, \u201cdormindo tranquilamente\u201d. Especialmente quando enfrentamos problemas recorrentes e incidentes frequentemente detectados ou relatados pelos clientes, sem a exist\u00eancia de medidas preventivas no nosso backlog ou a\u00e7\u00f5es planejadas para reduzir o alcance do impacto. E fica evidente a necessidade de garantir o pilar base SRE,\u00a0monitoramento\/observabilidade\u00a0para poder ter dados claros \u201cdata-driven\u201d e deixar de ser uma team reativa<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-382591c elementor-widget elementor-widget-image\" data-id=\"382591c\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;tj-animation&quot;:&quot;none&quot;}\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1000\" height=\"1000\" src=\"https:\/\/new1tech.net\/wp-content\/uploads\/2024\/09\/designer-8.jpeg\" class=\"attachment-large size-large wp-image-1059\" alt=\"\" srcset=\"https:\/\/new1tech.net\/wp-content\/uploads\/2024\/09\/designer-8.jpeg 1024w, https:\/\/new1tech.net\/wp-content\/uploads\/2024\/09\/designer-8-300x300.jpeg 300w, https:\/\/new1tech.net\/wp-content\/uploads\/2024\/09\/designer-8-150x150.jpeg 150w, https:\/\/new1tech.net\/wp-content\/uploads\/2024\/09\/designer-8-768x768.jpeg 768w, https:\/\/new1tech.net\/wp-content\/uploads\/2024\/09\/designer-8-12x12.jpeg 12w\" sizes=\"(max-width: 1000px) 100vw, 1000px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>No setor de enterprise IT, muitas organiza\u00e7\u00f5es discutem a ado\u00e7\u00e3o da transforma\u00e7\u00e3o digital. No entanto, parece que elas se concentram maioritariamente no lado mais agrad\u00e1vel, os \u201cmomentos de paz\u201d, deixando de lado os per\u00edodos de crise, ou seja, os incidentes. Sim, incidentes, comportamentos inesperados ocorrer\u00e3o com seu servi\u00e7o ou plataforma. Voc\u00ea possui um processo de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1039,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_joinchat":[],"footnotes":""},"categories":[1],"tags":[],"class_list":["post-628","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnology"],"acf":[],"_links":{"self":[{"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/posts\/628","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/comments?post=628"}],"version-history":[{"count":84,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/posts\/628\/revisions"}],"predecessor-version":[{"id":1101,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/posts\/628\/revisions\/1101"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/media\/1039"}],"wp:attachment":[{"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/media?parent=628"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/categories?post=628"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/new1tech.net\/pt\/wp-json\/wp\/v2\/tags?post=628"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}