Accéder au contenu principal Passer au contenu complémentaire

tMilvusInput

Ce composant récupère des enregistrements d'une collection de la base de données Milvus et les transfère au composant suivant.

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Propriétés du tMilvusInput Standard

Ces propriétés sont utilisées pour configurer le tMilvusInput s'exécutant dans le framework de Jobs Standard.

Le composant tMilvusInput Standard appartient à la famille Bases de données.

Basic settings

Use existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Collection Saisissez le nom de la collection dans la base de données Milvus, ou cliquez sur le bouton [...] près du champ correspondant, afin de récupérer les collections disponibles et sélectionner celle de votre choix.
Operation (Opération) Sélectionnez le type d'opération à effectuer sur les données de la collection :
  • QUERY : spécifiez une requête à l'aide de filtres.
  • SEARCH : utilisez les fonctionnalités de recherche vectorielle et spécifiez la requête à l'aide de la propriété queryVector.

Si vous utilisez des champs dynamiques pour spécifier la collection, notez que le mode QUERY crée une sortie normale, tandis que le mode SEARCH génère une nouvelle colonne nommée $meta, contenant tous les champs dynamiques.

Query vector Ce composant supporte les fonctionnalités de recherche vectorielle. Vous pouvez utiliser cette option pour spécifier la condition de requête via la propriété queryVector. Le vecteur de cette requête doit être un tableau JSON ou un tableau d'un tableau par exemple [1,0,1,0,1] et [[1,0,1],[1,0,1],[0,1,1]].

Pour plus d'informations concernant les recherches vectorielles dans Milvus, consultez la documentation Milvus (en anglais).

Ce champ est disponible uniquement lorsque vous avez sélectionné l'option SEARCH dans la liste déroulante Operation.

Filter Saisissez une requête pour filtrer des enregistrements spécifiques dans les données de la collection.

Par exemple, saisissez id < 50 afin de récupérer les enregistrements dont l'id est inférieur à 50, dans la collection spécifiée dans le champ Collection.

Limit et Offset
  • Limit : saisissez le nombre d'entités à inclure dans les résultats de recherche.
  • Offset : saisissez le nombre total d'entités déjà retournées.

Pour plus d'informations concernant ces deux paramètres, consultez la documentation Milvus (en anglais).

Advanced settings

tStatCatcher Statistics Cochez cette case afin de collecter les données de log au niveau des composants.
Partition Cochez la case pour lire les données en partitions.

Saisissez le nom, entre guillemets doubles, de la colonne ou des colonnes de partition de la table Milvus de laquelle lire les données, ou cliquez sur le bouton [...] près du champ correspondant pour sélectionner les colonnes.

Si vous devez lister plusieurs valeurs, séparez-les par une virgule.

Load collection into memory Cochez cette case pour charger dans la mémoire la collection sélectionnée lors de l'exécution du Job.

Variables globales

Variables globales

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables.

Utilisation

Règle d'utilisation
  • Le composant tMilvusInput est un composant de début. Il vous permet de récupérer des enregistrements d'une collection dans la base de données Milvus et de les transférer au composant suivant, pour affichage ou stockage.
  • Vous pouvez écrire des champs dans un type dynamique à l'aide du composanttWriteDynamicFields, List compris.
  • Les proxys HTTP et HTTPS sont supportés par ce composant.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.