Aula de Exercícios Open Refine – parte 2

  • Neste exercício, vamos usar os tipos de dados Boolean e Array.
  • Se você observar a coluna do autor, verá que a maioria dos nomes dos autores é escrita na ordem natural.
  • No entanto, alguns foram revertidos para colocar o nome da família em primeiro lugar.
  • Podemos fazer um teste bruto para nomes de autores invertidos, procurando por aqueles que contenham uma vírgula:
    • Certifique-se de que você já dividiu os nomes dos autores em células individuais usando ‘Editar células-> Dividir células com múltiplos valores’ (você deveria ter feito isso no exercício 5)
    • Na coluna de autor, use o menu suspenso e selecione “Faceta -> Faceta de texto personalizada …”
    • A função de faceta de texto personalizado permite que você escreva funções GREL para criar uma faceta
    • No tipo de caixa de expressão toString(value.contains(“,”))
    • Clique OK’
    • Como a função ‘contains’ gera um valor booleano, você deve ver uma faceta que contém ‘false’ e ‘true’. Estes representam o resultado da expressão, ou seja, true = valores contendo uma vírgula; false = valores sem vírgula
    • Nesta faceta, selecione ‘true’ para restringir aos nomes dos autores que contenham uma vírgula.
    • Como podemos fazer isso usando as funções reverse() e join()?