Resumo:
A doença de COVID-19 tem sido um dos maiores desafios do século XXI, com impactos imensuráveis afetando toda população mundial. A COVID-19 teve seu primeiro caso em dezembro de 2019 em Wuhan, na China. Após 3 meses, ela foi reconhecida como uma pandemia em razão de sua propagação por meio de gotículas, secreções respiratórias e contato físico com o paciente infectado, o que faz com que tenha uma alta taxa de transmissão. A mortalidade relativa ao número de contaminados é baixa, entretanto
o número de mortes em números absolutos é alto por conta da alta transmissibilidade. Desse modo, diversas iniciativas ao redor do mundo têm sido realizadas para conhecê-la, preveni-la, diagnosticá-la e curá-la. A doença também tem sido estudada diante da perspectiva da Aprendizagem de máquina para o diagnóstico da doença. Em Caçador, para ser realizado o diagnóstico da doença através do Sistema Único de Saúde (SUS), o processo leva a cerca de 11 dias entre o acompanhamento do paciente, o exame de PCR e o seu resultado. Com o objetivo de reduzir o tempo e o custo do diagnóstico, este trabalho propõe a utilização de informações obtidas a partir de exames de sangue, exames de urina e do uso de modelos inteligentes de Aprendizagem de Máquina para a predição do diagnóstico do COVID-19. Dessa forma, é estimada redução dos custos, tendo em vista o baixo custo dos exames de sangue e urina e do tempo para o resultado do exame que é de no máximo 24 horas após a coleta, o que pode ser crucial, considerando a contaminação de pessoas próximas ao paciente, além de auxiliar os governos na redução de custo com o diagnóstico. Os algoritmos de Aprendizagem de Máquina utilizados nesta pesquisa, são os modelos de Árvore de Decisão, Floresta Aleatória, k-Nearest Neighbor (k-NN), Máquina de Vetores de Suporte e Naïve Bayes. Os resultados apresentam que o modelo de Máquina de Vetores de Suporte possui
uma maior taxa de acertos realizados, com uma taxa de 84% de acurácia. Além disso, para a classificação de indivíduos que possuem a doença, o modelo apresentou a maior taxa de acerto, a qual corresponde à 66%. Os resultados obtidos mostram que os modelos gerados neste trabalho a partir dos exames de sangue e urina não contribuem de forma definitiva para a solução do problema, podendo apenas auxiliar no diagnóstico de forma complementar, sugerindo apenas um indicativo para a doença. Ainda assim, o
melhor modelo obtido, com 84% de acurácia, possui desempenho melhor que um classificador aleatório (que alcançaria aproximadamente 50% de acurácia com as classes balanceadas), sugerindo que modelos de Aprendizagem de Máquina desenvolvidos nesta pesquisa aprenderam padrões que podem levar ao diagnóstico correto, mesmo de forma complementar.