banner
Maison / Blog / Prétraitement des courbes d'absorption térahertz par contrainte d'ondulation étroite et sa mise en œuvre rapide suggérée par une coque convexe
Blog

Prétraitement des courbes d'absorption térahertz par contrainte d'ondulation étroite et sa mise en œuvre rapide suggérée par une coque convexe

Aug 03, 2023Aug 03, 2023

Rapports scientifiques volume 12, Numéro d'article : 17806 (2022) Citer cet article

378 accès

Détails des métriques

Dans ce travail, une méthode de prétraitement de la courbe d'absorption THz est proposée, ce qui conduit à une plage d'absorption minimale, réservant l'ondulation nécessaire de la courbe pour l'identification par réseau neuronal convolutif. L'idée centrale de la méthode proposée consiste à confiner l'ondulation de la courbe avec une paire de lignes parallèles étroites et à résoudre leur position optimale par rotation consécutive de la courbe normalisée en deux points fixes. Un algorithme rapide est en outre proposé, basé sur les caractéristiques de l'enveloppe convexe, dont la procédure est décrite en détail. L'algorithme implique la définition de certains ensembles de points importants, le calcul et la comparaison des pentes et la détermination du meilleur choix parmi 4 rotations potentielles. La rationalité de la recherche du point critique est illustrée de manière géométrique. De plus, l'adaptation de la méthode est discutée et des exemples réels sont donnés pour montrer la capacité de la méthode à extraire des informations non linéaires d'une courbe. L'étude suggère que les méthodes concernant l'infographie contribuent également à l'extraction de caractéristiques en ce qui concerne la courbe THz et la reconnaissance de formes.

La spectroscopie dans le domaine temporel térahertz est largement utilisée pour la détection et l'identification de matériaux1,2,3,4. La courbe du coefficient d'absorption ou d'extinction est tellement liée aux constituants du matériau que la reconnaissance des formes est effectuée dans divers contextes5,6,7,8,9. Les pics d'absorption ne sont pas observés pour les substances pures ayant une structure moléculaire symétrique (par exemple le polyéthylène). En outre, les pics sont moins observables en raison du chevauchement du spectre des composants. Par conséquent, l'apprentissage automatique est important pour l'exploration de données dans les enquêtes impliquant, mais sans s'y limiter, les herbes, les viandes, le thé et les céréales, selon des rapports précédents. Il est suggéré que le prétraitement des courbes améliore les performances du modèle et réduit la difficulté de formation d'un modèle satisfaisant. Le prétraitement conventionnel comprend le lissage Savitzky-Golay, le filtrage dans le domaine fréquentiel, la correction de diffusion multivariée (MSC), etc., qui réservent des caractéristiques essentielles pour l'identification mais ajustent la valeur à chaque échantillonnage de fréquence10,11,12. Ces algorithmes prennent mathématiquement la forme de bruit et tous les points sont traités de la même manière. Cependant, la fonctionnalité d'identification des courbes peut être affaiblie et certains paramètres sont configurés de manière empirique pour obtenir de bons résultats. De plus, les méthodes impliquant l’infographie sont rarement étudiées pour combler les lacunes des méthodes d’identification ultérieures.

Le réseau neuronal convolutif (CNN) a été utilisé pour identifier un objet dans une image en tant que modèle efficace et populaire13,14,15,16. Lorsque CNN est associé à une courbe térahertz, une conversion (ou mappage) de la courbe THz en image est nécessaire avant l'entraînement du modèle. La courbe spectrale est considérée comme une limite significative dans l'image pour séparer la partie supérieure et la partie inférieure, qui n'ont cependant aucun sens car aucune valeur réelle ne les atteint. En conséquence, chaque pixel d’une image participe à la formation du modèle CNN. La compression de la plage d'absorption pour une bande de fréquence donnée répondrait aux attentes de réduction des coûts de calcul, alors que la difficulté est de réserver les caractéristiques essentielles à l'identification. Comme le montre la figure 1a, une courbe THz schématique a une plage égale à la différence entre offset1 et offset2. Les lignes 2 et 1 sont des lignes parallèles avec un axe de fréquence, qui indiquent les limites supérieure et inférieure de l'absorption. Si deux autres lignes parallèles sont utilisées pour confiner la courbe, l'ondulation (différence de décalage Y) entre elles change (comme le montrent les figures 1b et 1c). Ainsi, nous recherchons des lignes parallèles optimales pour confiner la courbe avec une distance minimale et effectuons une transformation de cisaillement pour générer une image qui s'adapte à la courbe traitée avec une redondance minimale dans la direction Y (dimension d'absorption). Éclairée par la pensée de base, la méthode proposée est nommée contrainte d'ondulation étroite (NUC).

0\); if the rotation is done clockwise, \(\theta <0\). It is reasonable to conclude that \(-0.5\pi <\theta <0.5\pi\) for all cases if cropping line are not orthogonal to X-axis./p> 0, the current X would be final output./p> offset1). A universal rule to claim P1, P2, Q1, Q2 is described as follow:/p> a1, a2 > b1 are satisfied, the adaption is bad because Ryi ≥ 1 for \(\mathrm{i}=\in \{\mathrm{1,2},\mathrm{3,4}\}\). When the above mentioned two expressions are neither satisfied, we would conclude b2 < a1 ≤ a2 < b1 that conflicts with b1 ≤ b2. If b2 < a1 and a2 > b1, k1* ≠ 0 and k4* ≠ 0 because a1 ≠ 1 and b2 ≠ N. Thus, Ry* < 1; if b2 > a1 and a2 < b1, k2* ≠ 0 and k3* ≠ 0 because a2 ≠ N and b2 ≠ 1. In summarize, the algorithm adapts to process curves which are governed by (43). That’s the reason why a judgement is needed to check if the curve can be effectively processed by the algorithm. It turns out that after one shear transformation, the adjusted curve may be proceeded further as expression (43) is still met. Thus, one can iterate the process discussed above until expression (43) is no longer valid. The algorithm is destined to terminate after several circulations because every polygon has a dimension orthogonal to one of its edges, which is smaller than any other dimension./p>