Commit e7d09a15 authored by Miguel Guerrero's avatar Miguel Guerrero

update gera_correlacoes

parent c7b35a43
......@@ -42,7 +42,8 @@ path_naladi_ncm_manual <- file.path(
"correlacoes",
"aladi",
"naladi_ncm",
"correlacao_ncm_naladi_manual.xlsx"
# "correlacao_ncm_naladi_manual.xlsx"
"correlacao_ncm_naladi_res_812.xlsx"
)
path_naladi <- file.path(
......@@ -114,33 +115,38 @@ write_parquet(correlacao_completa, "dados_gerados/dataset_ncm.parquet")
# Organiza dados da correlação NCM Naladi ---------------------------------
load(path_naladi_ncm)
# load(path_naladi_ncm)
naladi_ncm_manual <- read_xlsx(path_naladi_ncm_manual)
correlacao_completa <- correlacao_naladi_ncm |>
distinct() |>
rename_with(~str_to_upper(.x))
# obtem ultimo ano
colunas <- names(correlacao_completa)
colunas <- names(naladi_ncm_manual)
ano_max <- colunas |>
str_extract("[0-9]+") |>
max() |>
str_extract("\\d{4}") |>
max(na.rm = TRUE) |>
unique()
naladi_ncm_auto <- correlacao_completa |>
naladi_ncm_manual <- naladi_ncm_manual |>
select(contains(ano_max)) |>
distinct()
if(nrow(naladi_ncm_manual) >= nrow(naladi_ncm_auto)) {
naladi_ncm <- naladi_ncm_manual
} else {
naladi_ncm <- naladi_ncm_auto
}
# correlacao_completa <- correlacao_naladi_ncm |>
# distinct() |>
# rename_with(~str_to_upper(.x))
#
# # obtem ultimo ano
# colunas <- names(correlacao_completa)
#
# ano_max <- colunas |>
# str_extract("[0-9]+") |>
# max() |>
# unique()
#
# naladi_ncm_auto <- correlacao_completa |>
# select(contains(ano_max)) |>
# distinct()
naladi_ncm |>
naladi_ncm_manual |>
write_parquet("dados_gerados/dataset_naladi_ncm.parquet")
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment