dataCleaning
Essa ferramenta tem a finalidade de identificar possíveis erros e facilitar a padronização dos dados. Geralmente são erros pequenos e simples, onde uma letra é adicionada, trocada ou omitida. São erros difícies de serem encontrados em um grande conjunto de dados pela pequena diferença da ortografia.
Uma premissa do trabalho é não interferir na informação. Nenhum dado é modificado, o sistema apenas indica os registros "suspeitos", recomendando ao autor que confira e escolha entre corrigir ou não a informação.
A ferramenta ainda está em desenvolvimento e todas as sugestões serão bem vindas.
Selecione uma coleção
AcariESALQ
ALCB
Aranhas-Solobioma
ASE
BAH
BCTw
BGB
BHCB
BOTU
BOTw
BR
CARTSA
CBMAI
CECG
CEMeC
CEMT
CEPANN
CEPEC
CESJ
CE-UFPE
CFAF
CFEUnioeste
CG
CGMS
CIAMT
CIUFES
CM
CMPHRM
CMUFMT
CNMT
COLFlebIEC
COUFMT
CPAP
CPMA
CPUFMT
CRAR
CRHRO
CRI
CRMRO
CRM-UNESP
CSUEL
CVRD
DCBU
DSEC
DZSJRP-Acari
DZSJRP-Amphibia-adults
DZSJRP-Amphibia-tadpoles
DZSJRP-Chiroptera
DZSJRP-Pisces
DZUP-Ascidiacea
DZUP-Coleoptera
DZUP-Dermaptera
DZUP-Diptera
DZUP-Hymenoptera
DZUP-Lepidoptera
DZUP-Mammalia
DZUP-Trichoptera
EAC
EAFM
EAN
ESA
F_Botany_BR
Fiocruz-CAVAISC
Fiocruz-CBAM
Fiocruz-CBMA
Fiocruz-CCAMP
Fiocruz-CCBH
Fiocruz-CCER
Fiocruz-CCFF
Fiocruz-CCGB
Fiocruz-CCULI
Fiocruz-CEIOC
Fiocruz-CFAM
Fiocruz-CFP
Fiocruz-CHIOC
Fiocruz-CLEP
Fiocruz-CLIOC
Fiocruz-CMIOC
Fiocruz-CMM
Fiocruz-CMT
Fiocruz-COLFLEB
Fiocruz-COLPROT
Fiocruz-COLTRYP
Fiocruz-COLVEC
Fiocruz-CSIOC
Fiocruz-CTIOC
Fiocruz-CYP
FLOR
FNJV
FPR-Colombia
FUEL
Funed-Aran
Funed-Esc
Funed-Pol
Funed-Serp
Funed-Virus
FURB
HAS
HBRA
HCF
HERBAM
HFSL
HFSL-Fungos
HISA
HJ
HPL
HRCB
HSJRP
HSJRP-Algae
HSJRP-Bryophyta
HSJRP-Pteridophyta
HST
HTSA
HUCPE
HUCS
HUEFS
HUEG
HUEM
HUESB
HUESC
HUFU
HUMC
HUPG
HUTO
HVASF
HVAT
IAC
IAL-aves
IAL-roedores
IBSBF
IBSP-Acari
IBSP-Herpeto
IBSP-IB
ICN
IctioPk
INPA-Acanthocephala
INPA-Annelida
INPA-Arachnida-Acari
INPA-Arachnida-Amblypygi
INPA-Arachnida-Araneae
INPA-Arachnida-Opiliones
INPA-Arachnida-Palpigradi
INPA-Arachnida-Pseudoscorpiones
INPA-Arachnida-Ricinulei
INPA-Arachnida-Schizomida
INPA-Arachnida-Scorpiones
INPA-Arachnida-Solifugae
INPA-Arachnida-Thelyphonida
INPA-Carpoteca
INPA-Chilopoda
INPA-Crustacea
INPA-Diplopoda
INPA-Fungos
INPA-Herbario
INPA-Herpeto
INPA-Hymenoptera
INPA-Insecta-tipos
INPA-Mamiferos-tipos
INPA-Mollusca
INPA-Nemata
INPA-Pauropoda
INPA-Peixes
INPA-Plathyhelminthes
INPA-Porifera
INPA-Rotifera
INPA-Symphyla
INPAw
IPA
IRAI
JOI
JPB
LABEV
LabFito
LabZoo
LBMBP
LEBIC
LIRP
MAC
Mamiferos-ES
MBM
MBML-Anfibios
MBML-Aves
MBML-Herbario
MBML-Mamiferos
MBML-Peixes
MBML-Repteis
MCP
MCP-Anfibios
MCP-Aves
MCP-Crustaceos
MCP-Fosseis
MCP-Mamiferos
MCP-Moluscos
MCP-Peixes
MCP-Repteis
MCTP-Aracnideos
MCTP-Insetos
MEFEIS
MFS
MHNCI-Arachnida
MHNCI-Aves
MHNCI-Crustacea
MHNCI-Entomologia
MHNCI-Herpeto
MHNCI-Mamiferos
MHNCI-Miriapoda
MHNCI-Mollusca
MHNCI-Peixes
MIRR
MNHN_P_PC_BR
MOBOT_BR
MOSS
MPUC
MVZ_BR
MZUEL-Abelhas
MZUEL-Aves
MZUEL-Herpeto
MZUEL-Mamiferos
MZUEL-Peixes
MZUSP
NMNH-Botany_BR
NPM
NUP
NYBG_BR
OBIS_BR
OUPR
PBI_BR
PEUFR
R
RB
RBdna
RBw
RON
RPSP
R-Tipos
SinBiota
SLUI
SP
SP-Algae
SP-Bryophyta
SPF
SPF-Algae
SPFw
SPSF
TEPB
UB
UBTU
UEC
UFACPZ
UFES-CTA
UFES-Entomologia
UFES-Entomologia-Amostras
UFES-Malacologia
UFES-MAM
UFG
UFMT-A
UFMT-CAP
UFMT-R
UFP
UFP-Carpoteca
UFRGS
UFRN
UFRN-Fungos
UPCB
URM
VIES
XILOTSA
ZEE_AMPH
ZEE_AVI
ZEE_HERP
ZEE_ICTIO
ZEE_MAM
ZUEC-AMP
ZUEC-API
ZUEC-ARA
ZUEC-AST
ZUEC-AVE
ZUEC-BIV
ZUEC-BRA
ZUEC-CEP
ZUEC-COL
ZUEC-CPH
ZUEC-CRU
ZUEC-DIP
ZUEC-ECH
ZUEC-EPH
ZUEC-GAS
ZUEC-HOM
ZUEC-LEP
ZUEC-MAM
ZUEC-MYX
ZUEC-NEM
ZUEC-NEU
ZUEC-NMA
ZUEC-OPH
ZUEC-PIS
ZUEC-PLA
ZUEC-POL
ZUEC-POP
ZUEC-REP
coleção:
NMNH-Botany_BR
total de registros indexados
37662
- sem coordenadas geográficas
35373
- georeferenciados
2289
- georeferenciados bloqueados
0
- no mar
45
- número do catálogo em branco
0
menor: 2028958 maior: 2854088
[ gap ]
[ susp ]
registros repetidos
número do catálogo
0
registros duplicados
0
nome + número do coletor
0
última atualização
da coleção: 13-02-2008
do dataCleaning: 05-07-2010
distribuição geográfica das coletas da coleção
perfil da coleção
estatísticas do dataCleaning
análise da dispersão das coordenadas geográficas
dados taxonômicos
inventário
nome científico
-
coletor
-
tipos
família
não encontrado
genero
não encontrado
espécie
192 suspeito(s)
subespécie
não encontrado
autor
6944 suspeito(s)
duplicata
não encontrado
outras inconsistências
152 suspeito(s)
dados geográficos
inventário
país
-
estado
-
município
nome do país/estado
18 suspeito(s)
outlier
4 suspeito(s)
long/lat fora do limite mundial
não encontrado
long/lat iguais
não encontrado
long ou lat com zero
5 suspeito(s)
long/lat mar (Brasil)
31 suspeito(s)
nome do município (Brasil)
429 suspeito(s)
análise da coordenada (Brasil)
4 suspeito(s)
outras inconsistências
3 suspeito(s)
data da coleta
data da coleta menor que 1900
5291 suspeito(s)
ano da coleta maior que atualização
não encontrado
ano da coleta maior que identificação
21 suspeito(s)
sugestões para campos em branco
long/lat (Brasil)
4532 sugestões
nome país/estado
18 sugestões
nome município (Brasil)
1316 sugestões
busca
dataCleaning
email
Centro de Referência em Informação Ambiental, CRIA