dataCleaning
english
coleção: HUMC
A ferramenta visa identificar duplicatas com determinações distintas para auxiliar no processo de correção de erros ou na atualização da determinação do espécime. Os registros "suspeitos" são aqueles que possuem o mesmo nome e número de coletor, mas informações distintas nos campos "gênero + espécie + subespécie". Além de erros de digitação, essa comparação é útil para detectar diferentes determinações de duplicatas nos herbários participantes da rede speciesLink.
Coleções diferentes possuem padrões diferentes para o registro do(s) coletor(es). Para poder comparar esse campo, o sistema reconhece variações na ordem da escrita do nome e iniciais dos coletores. Por exemplo, Barbosa, E. é reconhecido como o mesmo que E. Barbosa. Também identifica o coletor principal quando registrado juntamente com os coletores secundários. Por exemplo Ferreira, C.A.C. é o mesmo que Ferreira, C.A.C.; Fiuza, E. & Thomas, W.W.
A lista está agrupada por nome e número de coletor, mas pode ser ordenada por família, gênero e última atualização.
A data da última atualização é a data na qual aquele registro entrou no sistema speciesLink. Quando uma coleção atualiza seus dados, os novos registros apresentam a última data de atualização, mas os antigos mantém a data original. Essa coluna pode ser usada como um controle de quais dados já foram revisados pela coleção.
Os filtros foram criados com a intenção de identificar os registros suspeitos com erros mais “grosseiros” para auxiliar o processo de correção e para contribuir com a completude e atualização da determinação, comparando-os com duplicatas de outros herbários.
Ao clicar no filtro 'família indeterminada', a lista mostra os registros que possuem determinação de família para uma coleção e ausência dessa informação na coleção consultada. O mesmo para 'gênero indeterminado'.
Clicando no item “mesma data de coleta” você restringe a lista aos registros que possuem o mesmo nome e número do coletor e a mesma data de coleta, o que aumenta a probabilidade dos registros de herbários diferentes realmente serem duplicatas.

Filtro: [sem filtro] [família indeterminada] [gênero indeterminado]   mesma data de coleta

collectorcollector numberdate collectedimgcatalognumberfamilygenusspeciessubspeciesidentified bydate identifiedstateprovincecountylastupdate
 
V.T. Rampin17682006-03-17HUMC 2000Boraginaceae IndetSão PauloRio Claro07 Feb 2013
Rampin, V.T.17682006-03-17HRCB 43448Boraginaceae CordiaecalyculataLombardi, J.A.2006-03São PauloRio Claro09 Feb 2024
V. T. Rampin17682006-03-17NY 1181660Boraginaceae CordiaecalyculataJ. A. Lombardi2006São PauloRio Claro Mun.21 Mar 2024
 
J.L.S Tannus6802003-09-24HUMC 1949Erythroxylaceae ErythroxylumcuneifoliumSão PauloRio Claro07 Feb 2013
Tannus, J.L.S.6802003-09-24  EAC 51904Erythroxylaceae ErythroxylumcampestreSão PauloBrotas01 Sep 2022
Tannus, J.L.S.6802003-09-24HRCB 43435Erythroxylaceae ErythroxylumcampestreSão PauloBrotas09 Feb 2024
 
J.L.S Tannus7422003-12-10HUMC 1969Bignoniaceae DistictellaelongataSão PauloBrotas07 Feb 2013
J.L.S.Tannus; F.Socolowski7422003-12-10  HST 21028Bignoniaceae Amphilophiumelongatum2016São PauloBrotas22 Nov 2022
 
J.L.S Tannus7592004-06-04HUMC 1970Asclepiadaceae OxypetalumappendiculatumSão PauloItirapina07 Feb 2013
Tannus, J.L.S.7592004-06-04HRCB 43455Apocynaceae OxypetalumbalansaeFarinaccio, M.A.2005-10São PauloItirapina09 Feb 2024
 
J.L.S Tannus7992004-12-22HUMC 1951Vochysiaceae QualeagrandifloraSão PauloRio Claro07 Feb 2013
Tannus, J.L.S.7992004-12-22  EAC 51902Vochysiaceae QualeamultifloraSão PauloBrotas01 Sep 2022