Séances de cours associées à Surveillance du confort thermique : des solutions non intrusives

Catégorisation visuelle finement grainée : Défis et solutions

Explore les défis et les solutions dans la catégorisation visuelle à grain fin, en mettant l'accent sur la vision informatique et l'apprentissage automatique.

Fondements de l'apprentissage automatique

Couvre les concepts fondamentaux de l'apprentissage automatique, y compris la classification, les algorithmes, l'optimisation, l'apprentissage supervisé, l'apprentissage par renforcement et diverses tâches telles que la reconnaissance d'images et la génération de texte.

Intelligence visuelle: Machines et esprits

Explore l'intelligence visuelle, la formation d'images, la vision par ordinateur et la compréhension de la représentation dans les machines et les esprits.

Computer Vision Basics: Traitement de l'image et détection des caractéristiques

Couvre les bases de la vision par ordinateur, en se concentrant sur les techniques de traitement d'image et la détection de caractéristiques.

Deep Learning : réseaux neuronaux convolutifs et techniques de formation

Discute des réseaux neuronaux convolutifs, de leur architecture, des techniques de formation et des défis tels que des exemples contradictoires en apprentissage profond.

Machine Learning pour l'extraction de fonctionnalités

Explore l'apprentissage automatique pour l'extraction de fonctionnalités, la vision 3D et les réseaux neuronaux en robotique mobile.

Récapitulation de l'historique de la vision de l'ordinateur

Offre une vue d'ensemble historique de la vision informatique, explorant les développements clés et les personnalités influentes dans le domaine.

Intelligence visuelle: Machines et esprits

Explore l'intelligence visuelle, couvrant la formation d'images, la perception, la vision par ordinateur, l'apprentissage par correspondance, l'analyse du mouvement et la reconnaissance dans les vidéos.

Vision par ordinateur: aperçus historiques et inspirations de projets

Explore le développement historique de la vision par ordinateur et inspire des idées de projet innovantes.

Reconnaissance d'images : jeux de données et algorithmes

Explore un article de 2019 sur la reconnaissance d'images, les défis liés aux ensembles de données, les biais et l'impact des ensembles de données à grande échelle sur les modèles d'apprentissage en profondeur.

Transformateurs dans la vision

Explore Transformers dans la vision informatique, se concentrant sur l'architecture 'Attention est tout ce dont vous avez besoin' et ses applications dans les tâches visuelles.

Topologie : Produits polyédriques et détection de contours

Explore les concepts de topologie et de détection de bord en vision par ordinateur, mettant en évidence l'importance des contours et des gradients dans l'analyse d'images.

Intelligence visuelle: Machines et esprits

Explore l'histoire et les techniques de la vision informatique, couvrant la formation d'images, la transformation, les perspectives dynamiques et les indices d'estimation 3D.

Délimitation : Techniques et applications

Explore les techniques de délimitation, y compris la transformation de Hough, l'orientation du gradient et la détection de forme, en soulignant l'importance de combiner des techniques basées sur des graphiques et l'apprentissage automatique.

Prise de décision quantique : la confidentialité du réseau neuronal

Couvre le modèle de prise de décision quantique et ses implications pour la confidentialité des réseaux neuronaux et la reconnaissance d'images.

Images de médias sociaux : Comprendre la perception de l’alimentation avec l’apprentissage profond

Explore l’apprentissage profond avec des images Instagram, comprend la perception des aliments, l’obésité et la santé mentale, et discute de l’impact des images des médias sociaux et des plateformes éphémères comme Snapchat.

Deep Learning: Explorer la vision et les transformateurs de langage

Couvre les architectures de transformateurs avancées en apprentissage profond, en se concentrant sur les modèles Swin, HUBERT et Flamingo pour les applications multimodales.

Évaluation de l'exactitude et de la robustesse de la machine sur ImageNet

Explore l'évaluation de la précision et de la robustesse de la machine et de l'homme sur ImageNet, en soulignant les progrès, les défis et la nécessité d'améliorer.

NFNets: Suppression du batchNorm pour la reconnaissance de l'image à haut rendement

Explore NFNets comme une alternative au BatchNorm dans ResNets, en obtenant des performances élevées sur ImageNet.

Rapport de stage: Hangqian Li

Couvre un rapport de stage au laboratoire Tencent Al, axé sur la reconstruction de l'avatar 3D et les techniques de rendu neuronal.