[TOS tutorial 08] Aggiunta di filtri basati su condizioni utilizzando il componente tMap
Questo tutorial spiega come impostare e configurare filtri da applicare agli output di tMap.
In questo tutorial viene impiegato Talend Open Studio for Data Integration versione 6.
1. Creazione di un nuovo job e aggiunta di un componente tMap
- In un nuovo job, aggiungi il file dei metadati "movies" come componente delimitato da input.
- Aggiungi un componente tMap per creare nuovi filtri.
- Crea un flusso di dati dal componente "movies" al componente tMap_1 collegando i due componenti e rinomina il collegamento "movies".
2. Aggiunta di un filtro per selezionare solo i film usciti dal 1990 in poi
- Per creare un nuovo output, fai doppio clic sul componente tMap_1 e nella sezione output della procedura guidata di tMap, fai clic sul pulsante [+] e assegna all'output il nome moviesFromThe90s.
- Seleziona tutte le colonne dell'input "movies", trascinale e rilasciale nell'output "moviesFromThe90s".
- Per creare un nuovo filtro basato sulle condizioni, fai clic su Activate Expression Filter (Attiva filtro espressioni).
- Per creare una condizione di filtro, fai clic sulla colonna releaseYear e trascinala sul campo del filtro espressioni, quindi digita >=1990.
3. Memorizzazione del risultato in un file
- Aggiungi un componente tFileOutputXML al job.
- Collega l'output Row (Riga) > moviesFromThe90s al componente tFileOutputXML_1. Rinomina il componente tFileOutputXML_1 movies>=1990.
- Per configurare il componente movies>= 1990, nella vista Component (Componente) del componente, specifica percorso e nome del file di output.
- Per rinominare il documento radice, nel campo Row tag (Tag riga), digita "movies" ed esegui il job.
- Per verificare il file moviesFromThe90s.xml, seleziona la cartella in cui il file è stato creato e fai clic sul file. Il file con l'elenco dei film usciti a partire dal 1990 viene visualizzato.
4. Creazione di un secondo filtro utilizzando due condizioni
- Crea un secondo filtro per visualizzare solo i film degli anni '80. La sintassi dei filtri condizionali segue le regole di Java. Puoi creare facilmente due condizioni utilizzando l'operatore Java && (AND).
- Esegui il job.
Il file con l'elenco dei film usciti dal 1980 al 1989 viene visualizzato.
5. Creazione di output filtrando i contenuti rifiutati
- Per creare un terzo filtro, nell'interfaccia tMap_1, aggiungi un altro output denominato moviesBefore80s e trascina in tale output tutte le colonne dell'input "movies".
- Per creare un output filtrando i contenuti rifiutati, fai clic su tMap Settings.
- Fai clic su […] nel campo Value (Valore) della proprietà Catch output reject (Acquisisci output rifiutato), quindi fai clic su true. In questo modo verranno raccolte tutte le righe di dati che non corrispondono a nessuna delle altre due condizioni.
- Aggiungi un componente tFileOutputXML denominato movies<1980, quindi collega la riga "moviesBefore80s" da tMap_1 a tale componente.
- Per configurare il componente movies<1980, nella vista Component (Componente), specifica percorso e nome del file di output.
- Esegui il job.
- Per verificare il file filterRejects.xml, seleziona la cartella in cui il file è stato creato e fai clic sul file.
Il file con l'elenco dei film usciti prima del 1980 viene visualizzato.
← TUTORIAL PRECEDENTE | TUTORIAL SUCCESSIVO →
Sei pronto a iniziare con Talend?
Altri articoli correlati
- Come iniziare a lavorare con Talend Open Studio for Data Integration
- [TOS tutorial 02] Reading a File
- [TOS tutorial 01] Presentazione di Talend Studio
- [TOS tutorial 03] Sorting a File
- [TOS tutorial 07] Configuring Joins in tMap
- [TOS tutorial 09] Using Context Variables
- [TOS tutorial 06] Come unire due sorgenti di dati con il componente tMap
- [TOS tutorial 05] Procedura in tre passaggi per filtrare i dati utilizzando il componente tMap
- [TOS tutorial 04] Creazione e uso di metadati
- [TOS tutorial 13] Running a Job on Spark
- [TOS tutorial 12] Scrittura e lettura di dati su file HDFS
- [TOS tutorial 11] Creating Cluster Connection Metadata from Configuration Files
- [TOS tutorial 10] Creating Cluster Connection Metadata
- [TOS tutorial 14] Running a Job on YARN