Query Cache effectue une recherche sur les données d'un cache en fonction des valeurs d'un ou de plusieurs champs de données et renvoie les données des enregistrements correspondants du cache, en les ajoutant à l'enregistrement du dataflow. La recherche de données dans un cache peut s'avérer plus performante que celle de données dans une base de données.
Il existe deux types de cache : les caches globaux et les caches locaux.
Options de cache global
Un cache global est un cache partagé à l'échelle du système qui réside en mémoire. Si vous souhaitez que le cache soit disponible pour différents dataflow, lorsque les données ne changent pas souvent ou restent relativement statiques ou encore lorsque l'espace de stockage n'est pas limité, optez pour un cache global. Un cache global est statique, car vous ne pouvez y écrire qu'une seule fois. Une fois créé, le cache ne peut pas être mis à jour.
Un cache global est créé par le stage Write to Cache. Avant d'utiliser un cache global, vous devez le renseigner à l'aide des données sur lesquelles vous souhaitez effectuer des recherches. Pour ce faire, créez un dataflow contenant le stage Write to Cache.
Nom de l'option |
Description |
---|---|
Cache type |
Sélectionnez l'option Cache global. |
Nom du cache |
Indique le cache que vous souhaitez interroger. Pour créer un cache, utilisez le stage Write to Cache. |
Champs de cache |
Cette colonne contient une liste des champs du cache. Vous ne pouvez pas modifier les noms de ces champs. |
Champs d’étape |
Cette colonne contient une liste des noms de champ utilisés dans le dataflow. Pour modifier le nom d'un champ, cliquez dessus et saisissez un nouveau nom. |
Type |
Cette colonne contient une liste des types de données de chaque champ de dataflow. |
Inclure |
Pour que la requête renvoie la valeur du champ de cache, cochez la case de cette colonne. Pour que la requête ne renvoie pas le champ de cache, décochez la case. |
Valeur d'erreur par défaut |
Indique la valeur à afficher dans le champ de dataflow en cas d'échec de la requête. La liste déroulante affiche les valeurs valides correspondant au type de données du champ interrogé. Par exemple, en cas d’entier, l’option affichée est -1. Vous pouvez également saisir une valeur dans ce champ. Le tableau ci-dessous dresse la liste des valeurs d’erreur par défaut valides pour différents types de données. |
Champ Clé |
Indique le champ du cache à utiliser comme clé de recherche. Si la valeur du champ de la colonne Champ d'entrée correspond à la valeur du champ de clé du cache, la requête renvoie les données de cet enregistrement dans le cache. |
Champ d’entrée |
Indique le champ de dataflow dont la valeur va être utilisée comme clé. Si la valeur de ce champ correspond à la valeur du champ de clé du cache, la requête renvoie les données de cet enregistrement dans le cache. |
Type de données | Valeur d'erreur par défaut valide ainsi que le type de données (entre parenthèses) | ||||||
---|---|---|---|---|---|---|---|
Null | -1 (Entier) |
1899- 12-30 12:00:00 (Date/Heure) |
1899- 12-30 (Date) |
12:00:00 (Heure) |
Faux | Vide | |
Date | |||||||
Entier | |||||||
Long | |||||||
Flottant | |||||||
Grand Décimale |
|||||||
Double | |||||||
Chaîne | |||||||
Temps | |||||||
Date/Heure | |||||||
Booléen |
Options de cache local
Nom de l'option | Description |
---|---|
Cache type | Indique l'option Cache local. |
Connexion |
Sélectionnez la connexion de base de données à utiliser. Vos choix varient en fonction des connexions qui sont définies dans le Gestionnaire de connexion de Spectrum Management Console. Si vous devez établir une nouvelle connexion à la base de données, ou en modifier ou supprimer une existante, cliquez sur Gérer connexions. Si vous ajoutez ou modifiez une connexion de base de données, remplissez ces champs :
|
Table/Vue | Indiquez la table ou la vue de la base de données que vous souhaitez interroger. |
Champs de base de données | Cette colonne contient une liste des champs de la base de données. Vous ne pouvez pas modifier les noms de ces champs. |
Champs d’étape | Cette colonne contient une liste des noms de champ utilisés dans le dataflow. Pour modifier le nom d'un champ, cliquez dessus et saisissez le nouveau nom. |
Type |
Cette colonne contient une liste des types de données de chaque champ de dataflow. |
Inclure |
Pour que la requête renvoie la valeur du champ de cache, cochez la case de cette colonne. Pour que la requête ne renvoie pas le champ de cache, décochez la case. |
Valeur d'erreur par défaut |
Indique la valeur à afficher dans le champ de dataflow en cas d'échec de la requête. La liste déroulante affiche les valeurs valides correspondant au type de données du champ interrogé. Par exemple, en cas d’entier, l’option affichée est -1. Vous pouvez également saisir une valeur dans ce champ. Le tableau ci-dessous dresse la liste des valeurs d’erreur par défaut valides pour différents types de données. |
Champ Clé | Indique le champ de la base de données à utiliser comme clé de recherche. Si la valeur du champ de la colonne Champ d'entrée correspond à la valeur de Champ clé dans la base de données, la requête renvoie les données de cet enregistrement de la base de données. |
Type | Type de données de la valeur Champ Clé |
Opérateur | Sélectionnez l'opérateur requis. Les opérateurs pris en charge sont les suivants :
|
Est constant | Cochez cette case si vous souhaitez que la requête renvoie une valeur basée sur une constante que vous saisissez, au lieu du champ d'entrée. |
Champ d’entrée | Indique le champ de dataflow dont la valeur va être utilisée comme clé. Si la valeur de ce champ correspond à la valeur de Champ clé dans la base de données, la requête renvoie les données de cet enregistrement de la base de données. |
Options de cache avancé
Nom de l'option | Description |
---|---|
Cache type | Indique l'option Cache avancé. |
Connexion | Sélectionnez la connexion de base de données à utiliser. Vos choix varient en fonction des connexions qui sont définies dans le Gestionnaire de connexion de Management Console. Si vous devez établir une nouvelle connexion à la base de données, ou en modifier ou supprimer une existante, cliquez sur Gérer. Si vous ajoutez ou modifiez une connexion de base de données, remplissez ces champs :
|
Requête | Fournit la requête SQL permettant de lire les données de la base de données. La requête peut lire les données de plusieurs tables. Remarque : Il est obligatoire de fournir un alias dans la requête.
|
Où | Ce texte est utilisé comme clause where pour rechercher le cache créé en fonction de la requête. L'utilisateur peut spécifier le champ d'entrée dans la requête à l'aide de l'opérateur $ comme préfixe. Par exemple, _id = ${_inputId}, où _inputId est le champ d'entrée et _id la colonne de recherche du cache. |
Obtenir les champs | Cette opération renseigne la grille avec les champs qui sont sélectionnés pour être mis en cache à l'aide de la requête SQL. |
Champs de base de données | Cette colonne contient une liste des champs récupérés dans la base de données. Vous ne pouvez pas modifier les noms de ces champs. |
Champs d’étape | Cette colonne contient une liste des noms de champ utilisés dans le dataflow. Pour modifier le nom d'un champ, cliquez dessus et saisissez le nouveau nom. |
Type | Cette colonne contient une liste des types de données de chaque champ de dataflow. |
Valeur d'erreur par défaut |
Indique la valeur à afficher dans le champ de dataflow en cas d'échec de la requête. La liste déroulante affiche les valeurs valides correspondant au type de données du champ interrogé. Par exemple, en cas d’entier, l’option affichée est -1. Vous pouvez également saisir une valeur dans ce champ. Le tableau ci-dessous dresse la liste des valeurs d’erreur par défaut valides pour différents types de données. |
L'onglet Exécution
Les options disponibles dans l'onglet Exécution sont communes aux caches globaux, locaux et avancés.
Nom de l'option |
Description |
---|---|
Match options |
Indique comment procéder s'il existe plusieurs enregistrements du cache correspondant à la requête.
|
Options d'étape | Cette section répertorie les options de dataflow utilisées dans la requête SQL de ce stage et vous permet de fournir une valeur par défaut pour toutes ces options. La colonne Nom répertorie les options, tandis que vous pouvez saisir les valeurs par défaut dans la colonne Valeur correspondante.
Remarque : La valeur par défaut fournie ici est également affichée dans la section Map dataflow options to stages de la boîte de dialogue Options de dataflow. La boîte de dialogue vous permet également de modifier la valeur par défaut. En cas de conflit des valeurs par défaut fournies pour une option via Options de stage, Options de dataflow et Job Executor, l’ordre de priorité est le suivant : valeur fournie via Job Executor > valeur définie via la boîte de dialogue Options de dataflow > valeur saisie via Options de stage.
|