Skip to content
Projects
Groups
Snippets
Help
Loading...
Help
Support
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in
Toggle navigation
D
dados_rastreador
Project overview
Project overview
Details
Activity
Releases
Repository
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Issues
0
Issues
0
List
Boards
Labels
Milestones
Merge Requests
0
Merge Requests
0
CI / CD
CI / CD
Pipelines
Jobs
Schedules
Packages
Packages
Container Registry
Analytics
CI / CD Analytics
Repository Analytics
Value Stream Analytics
Wiki
Wiki
Snippets
Snippets
Members
Members
Collapse sidebar
Close sidebar
Activity
Graph
Create a new issue
Jobs
Commits
Issue Boards
Open sidebar
Camex Público
dados_rastreador
Commits
ad6aeb85
Commit
ad6aeb85
authored
Sep 25, 2025
by
Miguel Guerrero
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
update dados e gera_correlacao
parent
5e15e31c
Changes
4
Hide whitespace changes
Inline
Side-by-side
Showing
4 changed files
with
39 additions
and
16 deletions
+39
-16
dados_gerados/dataset_naladi_ncm.parquet
dados_gerados/dataset_naladi_ncm.parquet
+0
-0
dados_gerados/dataset_ncm.parquet
dados_gerados/dataset_ncm.parquet
+0
-0
dados_gerados/ncms_originais.rds
dados_gerados/ncms_originais.rds
+0
-0
scripts/gera_correlacoes.R
scripts/gera_correlacoes.R
+39
-16
No files found.
dados_gerados/dataset_naladi_ncm.parquet
View file @
ad6aeb85
No preview for this file type
dados_gerados/dataset_ncm.parquet
View file @
ad6aeb85
No preview for this file type
dados_gerados/ncms_originais.rds
View file @
ad6aeb85
No preview for this file type
scripts/gera_correlacoes.R
View file @
ad6aeb85
...
...
@@ -36,6 +36,15 @@ path_naladi_ncm <- file.path(
"correlacao_naladi_ncm.Rda"
)
path_naladi_ncm_manual
<-
file.path
(
Sys.getenv
(
"general"
),
"Bases"
,
"correlacoes"
,
"aladi"
,
"naladi_ncm"
,
"correlacao_ncm_naladi_manual.xlsx"
)
path_naladi
<-
file.path
(
Sys.getenv
(
"general"
),
"Bases"
,
...
...
@@ -56,9 +65,13 @@ filtra_mudancas <- function(x, padrao) {
x
|>
select
(
matches
(
padrao
))
|>
filter
(
# seleciona as linhas que tem algum valor diferente de NA com exceção
# de dados na primeira coluna
if_any
(
-1
,
~
!
is.na
(
.
))
)
|>
mutate
(
!!
padrao
:=
do.call
(
coalesce
,
as.list
(
across
(
-1
))))
|>
# cria uma coluna preenchendo-a com a primeira informação não NA da
# direita para a esquerda
mutate
(
!!
padrao
:=
do.call
(
coalesce
,
rev
(
as.list
(
across
(
-1
)))))
|>
select
(
ncm_original
=
1
,
last_col
()
...
...
@@ -85,8 +98,8 @@ saveRDS(ncms_originais, "dados_gerados/ncms_originais.rds")
load
(
path_ncm
)
correlacao_completa
<-
correlacao_completa_ncm_mercosul
%>%
distinct
()
%>%
correlacao_completa
<-
correlacao_completa_ncm_mercosul
|>
distinct
()
|>
rename_with
(
~
str_to_upper
(
.x
))
write_parquet
(
correlacao_completa
,
"dados_gerados/dataset_ncm.parquet"
)
...
...
@@ -96,21 +109,31 @@ write_parquet(correlacao_completa, "dados_gerados/dataset_ncm.parquet")
load
(
path_naladi_ncm
)
correlacao_completa
<-
correlacao_naladi_ncm
%>%
distinct
()
%>%
naladi_ncm_manual
<-
read_xlsx
(
path_naladi_ncm_manual
)
correlacao_completa
<-
correlacao_naladi_ncm
|>
distinct
()
|>
rename_with
(
~
str_to_upper
(
.x
))
# obtem ultimo ano
colunas
<-
names
(
correlacao_completa
)
ano_max
<-
colunas
%>%
str_extract
(
"[0-9]+"
)
%>%
max
()
%>%
ano_max
<-
colunas
|>
str_extract
(
"[0-9]+"
)
|>
max
()
|>
unique
()
correlacao_completa
%>%
select
(
contains
(
ano_max
))
%>%
distinct
()
%>%
naladi_ncm_auto
<-
correlacao_completa
|>
select
(
contains
(
ano_max
))
|>
distinct
()
if
(
length
(
naladi_ncm_manual
)
>=
length
(
naladi_ncm_auto
))
{
naladi_ncm
<-
naladi_ncm_manual
}
else
{
naladi_ncm
<-
naladi_ncm_auto
}
naladi_ncm
|>
write_parquet
(
"dados_gerados/dataset_naladi_ncm.parquet"
)
...
...
@@ -118,14 +141,14 @@ correlacao_completa %>%
load
(
path_naladi
)
correlacao_completa
<-
correlacao_completa_naladi_naladi_ncmtracker
%>%
correlacao_completa
<-
correlacao_completa_naladi_naladi_ncmtracker
|>
# naladi 1983 tem 7 ou 8 digitos. os 8 digitos da naladi 1983 surgiram em 1992.
# como logo em seguida veio a naladi_1993 com 8 digitos, vamos
# descartar os codigos de 8 dígitos da naladi_1983.
# filter(nchar(naladi_1983) == 9)
%>%
# 9 digitos equivale a 7 digitos se contarmos os pontos
distinct
()
%>%
rename_with
(
~
str_to_upper
(
.x
))
%>%
mutate
(
NALADI_1983
=
str_remove_all
(
NALADI_1983
,
"\\."
))
%>%
# filter(nchar(naladi_1983) == 9)
|>
# 9 digitos equivale a 7 digitos se contarmos os pontos
distinct
()
|>
rename_with
(
~
str_to_upper
(
.x
))
|>
mutate
(
NALADI_1983
=
str_remove_all
(
NALADI_1983
,
"\\."
))
|>
mutate
(
NALADI_1983
=
str_c
(
str_sub
(
NALADI_1983
,
1
,
2
),
"."
,
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment