dataCleaning
english
coleção: HEPH
A ferramenta visa identificar duplicatas com determinações distintas para auxiliar no processo de correção de erros ou na atualização da determinação do espécime. Os registros "suspeitos" são aqueles que possuem o mesmo nome e número de coletor, mas informações distintas nos campos "gênero + espécie + subespécie". Além de erros de digitação, essa comparação é útil para detectar diferentes determinações de duplicatas nos herbários participantes da rede speciesLink.
Coleções diferentes possuem padrões diferentes para o registro do(s) coletor(es). Para poder comparar esse campo, o sistema reconhece variações na ordem da escrita do nome e iniciais dos coletores. Por exemplo, Barbosa, E. é reconhecido como o mesmo que E. Barbosa. Também identifica o coletor principal quando registrado juntamente com os coletores secundários. Por exemplo Ferreira, C.A.C. é o mesmo que Ferreira, C.A.C.; Fiuza, E. & Thomas, W.W.
A lista está agrupada por nome e número de coletor, mas pode ser ordenada por família, gênero e última atualização.
A data da última atualização é a data na qual aquele registro entrou no sistema speciesLink. Quando uma coleção atualiza seus dados, os novos registros apresentam a última data de atualização, mas os antigos mantém a data original. Essa coluna pode ser usada como um controle de quais dados já foram revisados pela coleção.
Os filtros foram criados com a intenção de identificar os registros suspeitos com erros mais “grosseiros” para auxiliar o processo de correção e para contribuir com a completude e atualização da determinação, comparando-os com duplicatas de outros herbários.
Ao clicar no filtro 'família indeterminada', a lista mostra os registros que possuem determinação de família para uma coleção e ausência dessa informação na coleção consultada. O mesmo para 'gênero indeterminado'.
Clicando no item “mesma data de coleta” você restringe a lista aos registros que possuem o mesmo nome e número do coletor e a mesma data de coleta, o que aumenta a probabilidade dos registros de herbários diferentes realmente serem duplicatas.

Filtro: [sem filtro] [família indeterminada] [gênero indeterminado]   mesma data de coleta

collectorcollector numberdate collectedimgcatalognumberfamilygenusspeciessubspeciesidentified bydate identifiedstateprovincecountylastupdate
 
Oliveira, RC10231998-03-10HEPH 13998CyperaceaeOliveira, RCMaranhãoBalsas03 May 2023
Oliveira, RC; Silva, GP10231998-03-10  ICN 156899Cyperaceae BulbostylisAraújo, AC2008MABalsas29 Mar 2023
 
Vervloet, RR; Fontana, AP; Britto, RC de25762003-12-24HEPH 31460Espírito SantoSão Roque do Canaã01 Sep 2023
Vervloet, RR; Fontana, AP; Brito, RC de25762003-12-24  JPB 55309Solanaceae BrunfelsiaFigueira, M2017-07-21Espírito SantoSão Roque do Canaã07 Aug 2023
 
Fonseca, ML19741998-08-18HEPH 15124MelastomataceaeFonseca, MLGoiásSerranópolis03 May 2023
Fonseca, ML; et al.19741998-08-18SP 335008Melastomataceae LeandraviscosaReginato, M2013-01GoiásSerranópolis20 Apr 2023
 
Heringer, EP12961963-03-05HEPH 1398SapotaceaeDistrito FederalBrasília03 May 2023
Heringer, EP12961963-03-05  UBSapotaceae ChrysophyllumhoehneiTeixeira, LOA1980-10-17Distrito FederalBrasília01 Feb 2024
 
Fonseca, ML19741998-08-18HEPH 15124MelastomataceaeFonseca, MLGoiásSerranópolis03 May 2023
Fonseca, ML; Alvarenga, D; Silva, MA; Arruda, VR19741998-08-18  UB 181352Melastomataceae ClidemiaGoiásSerranópolis01 Feb 2024
 
Mendonça, RC13191989-03-20HEPH 7352FabaceaeMendonça, RC1989GoiásLeopoldo de Bulhões03 May 2023
Mendonça, RC13191989-03-20  UB 42000Fabaceae GalactiaQueiroz, RTGoiásLeopoldo de Bulhões01 Feb 2024
Mendonça, RC; et al.13191989-03-20  UEC 52066Fabaceae CamptosemaellipticumQueiroz, LP2001GoiásLeopoldo de Bulhôes09 Jan 2024
 
Oliveira, RC1822006-12-06HEPH 26118FabaceaeOliveira, RC2006Rio Grande do NorteMossoró03 May 2023
Oliveira, RC; Silva, ML1822006-12-06  UFP 58577Fabaceae-Papi. Sp.Rio Grande do NorteMossoró17 Nov 2023
Oliveira, RC; Silva, ML1822006-12-06UFPFabaceae-Papi. Sp.Rio Grande do NorteMossoró17 Nov 2023