LCC 315 - les températures ne sont pas déterministes - Les Cast Codeurs Podcast

JVM summit, virtual threads, stacks applicatives, licences, déterminisme et LLMs, quantification, deux outils de l'épisode et bien plus encore.

Enregistré le 13 septembre 2024

Téléchargement de l'épisode LesCastCodeurs-Episode–315.mp3

News Langages

Netflix utilise énormément Java et a rencontré un problème avec les Virtual Thread dans Java 21. Les ingénieurs de Netflix analysent ce problème dans cet article : https://netflixtechblog.com/java–21-virtual-threads-dude-wheres-my-lock–3052540e231d

Les threads virtuels peuvent améliorer les performances mais posent des défis.
Un problème de locking a été identifié : les threads virtuels se bloquent mutuellement.
Cela entraîne des performances dégradées et des instabilités.
Netflix travaille à résoudre ces problèmes et à tirer pleinement parti des threads virtuels.

Une syntax pour indiquer qu'un type est nullable ou null-restricted arriverait dans Java https://bugs.openjdk.org/browse/JDK–8303099

Foo! interdirait null
Foo? indiquerait que null est accepté
Foo?[]! serait un tableau non-null de valeur nullable
Il y a aussi des idées de syntaxe pour initialiser les tableaux null-restricted
JEP: https://openjdk.org/jeps/8303099

Les vidéos du JVM Language Summit 2024 sont en ligne https://www.youtube.com/watch?v=OOPSU4LnKg0&list=PLX8CzqL3ArzUEYnTa6KYORRbP3nhsK0L1

Project Leyden Update
Project Babylon - Code Reflection
Valhalla - Where Are We?
An Opinionated Overview on Static Analysis for Java Rethinking Java String Concatenation
Code Reflection in Action - Translating Java to SPIR-V Java in 2024
Type Specialization of Java Generics - What If Casts Have Teeth ? (avec notre Rémi Forax national !)
aussi tip or tail pour tout l'ecosysteme
quelques liens sur Babylon: Code reflection pour exprimer des langages etranger (SQL) dans Java: https://openjdk.org/projects/babylon/ et sont example en emulation de LINQ https://openjdk.org/projects/babylon/articles/linq

Librairies

Micronaut sort sa version 4.6 https://micronaut.io/2024/08/26/micronaut-framework–4–6–0-released/

essentiellement une grosse mise à jour de tonnes de modules avec les dernières versions des dépendances

Microprofile 7 faire quelques changements et evolution incompatibles https://microprofile.io/2024/08/22/microprofile–7–0-release/#general

enleve Metrics et remplace avec Telemetry (metrics, log et tracing)
Metrics reste une spec mais standalone
Microprofile 7 depende de Jakarta Core profile et ne le package plus
Microprofile OpenAPI 4 et Telemetry 2 amenent des changements incompatibles

Quarkus 3.14 avec LetsEncrypt et des serialiseurs JAckson sans reflection https://quarkus.io/blog/quarkus–3–14–1-released/

Hibernate ORM 6.6
Serialisateurs JAckson sans reflection
installer des certificats letsencrypt simplement (notamment avec la ligne de commande qui aide
sympa notamment avec ngrok pour faire un tunnel vers son localhost
retropedalage sur @QuarkusTestResource vs @WithTestResource suite aux retour de OOME et lenteur des tests mieux isolés

Les logs structurées dans Spring Boot 3.4 https://spring.io/blog/2024/08/23/structured-logging-in-spring-boot–3–4

Les logs structurées (souvent en JSON) vous permettent de les envoyer facilement vers des backends comme Elastic, AWS CloudWatch…
Vous pouvez les lier à du reporting et de l'alerting.
Spring Boot 3.4 prend en charge la journalisation structurée par défaut. Il prend en charge les formats Elastic Common Schema (ECS) et Logstash, mais il est également possible de l'étendre avec vos propres formats.
Vous pouvez également activer la journalisation structurée dans un fichier. Cela peut être utilisé, par exemple, pour imprimer des journaux lisibles par l'homme sur la console et écrire des journaux structurés dans un fichier pour l'ingestion par machine.

Infrastructure

CockroachDB qui avait une approche Business Software License (source available puis ALS 3 ans apres), passe maintenant en license proprietaire avec source available https://www.cockroachlabs.com/blog/enterprise-license-announcement/

Polyform project offre des licences standardisees selon les besoins de gratuit vs payant https://polyformproject.org/

Cloud

Azure fonctions, comment le demarrage a froid est optimisé https://www.infoq.com/articles/azure-functions-cold-starts/?utm_campaign=infoq_content&utm_source=twitter&utm_medium=feed&utm_term=Cloud

fonctions ont une latence naturelle forte
toutes les lantences longues ne sont aps impactantes pour le business
les demarrages a froid peuvent etre mesures avec les outils du cloud provider donc faites en usage
faites des decentilers de latences
experience 381 ms cold et 10ms apres
tracing pour end to end latence
les strategies
keep alive pings: reveiller la fonctione a intervalles reguliers pour rester "warm"
dans le code de la fonction: initialiser les connections et le chargement des assemblies dans l'initialization
configurer dans host.json le batching, desactiver file system logging etc
deployer les fonctions as zips
reduire al taille du code et des fichiers (qui sont copies sur le serveur froid)
sur .net activer ready to run qui aide le JIT compiler
instances azure avec plus de CPU et memoire sont plus cher amis baissent le cold start
dedicated azure instances pour vos fonctions (pas aprtage avec les autres tenants)
ensuite montre des exemples concrets

Web

Sortie de Vue.js 3.5 https://blog.vuejs.org/posts/vue–3–5

Vue.JS 3.5: Nouveautés clés
Optimisations de performance et de mémoire:
Réduction significative de la consommation de mémoire (–56%).
Amélioration des performances pour les tableaux réactifs de grande taille.
Résolution des problèmes de valeurs calculées obsolètes et de fuites de mémoire.
Nouvelles fonctionnalités:
Reactive Props Destructure: Simplification de la déclaration des props avec des valeurs par défaut.
Lazy Hydration: Contrôle de l'hydratation des composants asynchrones.
useId(): Génération d'ID uniques stables pour les applications SSR.
data-allow-mismatch: Suppression des avertissements de désynchronisation d'hydratation.
Améliorations des éléments personnalisés: Prise en charge de configurations d'application, d'API pour accéder à l'hôte et au shadow root, de montage sans Shadow DOM, et de nonce pour les balises.
useTemplateRef(): Obtention de références de modèle via l'API useTemplateRef().
Teleport différé: Téléportation de contenu vers des éléments rendus après le montage du composant.
onWatcherCleanup(): Enregistrement de callbacks de nettoyage dans les watchers.

Data et Intelligence Artificielle

On entend souvent parler de Large Language Model quantisés, c'est à dire qu'on utilise par exemple des entiers sur 8 bits plutôt que des floatants sur 32 bits, pour réduire les besoins mémoire des GPU tout en gardant une précision proche de l'original. Cet article explique très visuellement et intuitivement ce processus de quantisation : https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-quantization

Guillaume continue de partager ses aventures avec le framework LangChain4j. Comment effectuer de la classification de texte : https://glaforge.dev/posts/2024/07/11/text-classification-with-gemini-and-langchain4j/

en utilisant la classe TextClassification de LangChain4j, qui utilise une approche basée sur les vector embeddings pour comparer des textes similaires
en utilisant du few-shot prompting, sous différentes variantes, dans cet autre article : https://glaforge.dev/posts/2024/07/30/sentiment-analysis-with-few-shots-prompting/
et aussi comment faire du multimodal avec LangChain4j (avec le modèle Gemini) pour analyser des textes, des images, mais également des vidéos, du contenu audio, ou bien des fichiers PDFs : https://glaforge.dev/posts/2024/07/25/analyzing-videos-audios-and-pdfs-with-gemini-in-langchain4j/

Pour faire varier la prédictibilité ou la créativité des LLMs, certains hyperparamètres peuvent être ajustés, comme la température, le top-k et le top-p. Mais est-ce que vous savez vraiment comment fonctionnent ces paramètres ? Deux articles très clairs et intuitifs expliquent leur fonctionnement : https://medium.com/google-cloud/is-a-zero-temperature-deterministic-c4a7faef4d20 https://medium.com/google-cloud/beyond-temperature-tuning-llm-output-with-top-k-and-top-p–24c2de5c3b16

la tempoerature va ecraser la probabilite du prochain token mais il reste des variables: approximnation des calculs flottants, stacks differentes effectuants ces choix differemment, que faire en cas d'egalité de probabilité entre deux tokens
mais il y a d'atures apporoches de configuiration des reaction du LLM: top-k (qui evite les tokens peu frequents), top-p pour avoir les n des tokens qui totalient p% des probabilités
temperature d'abord puis top-k puis top-p
explique quoi utiliser quand

OSI propose une definition de l'IA open source https://www.technologyreview.com/2024/08/22/1097224/we-finally-have-a-definition-for-open-source-ai/

gros debats ces derniers mois
utilisable pour tous usages sans besoin de permission
chercheurs peuvent inspecter les components et etudier comment le system fonctionne
systeme modifiable pour tout objectif y compris chager son comportement
et paratger avec d'autres avec ou sans modification quelque soit l'usage
Definit des niveaux de transparence (donnees d'entranement, code source, poids)

Une longue rétrospective de PostgreSQL a des volumes de malades et les problèmes de lock https://ardentperf.com/2024/03/03/postgres-indexes-partitioning-and-lwlocklockmanager-scalability/

un article pour vous rassurer que vous n'aurez probablement jamais le problème
histoire sous forme de post mortem
des conseils pour éviter ces falaises

Outillage

Un premier coup d'oeil à la future notation déclarative de Gradle https://blog.gradle.org/declarative-gradle-first-eap

un article qui explique à quoi ressemble cette nouvelle syntaxe déclarative de Gradle (en plus de Groovy et Kotlin)
Quelques vidéos montrent le support dans Android Studio, pour le moment, ainsi que dans un outil expérimental, en attendant le support dans tous les IDEs
L'idée est d'éviter le scripting et d'avoir vraiment qu'une description de son build
Cela devrait améliorer la prise en charge de Gradle dans les IDEs et permettre d'avoir de la complétion rapide, etc
c'est moi on on a Maven là?

Support de Firefox dans Puppeteer https://hacks.mozilla.org/2024/08/puppeteer-support-for-firefox/

Puppeteer, la bibliothèque d'automatisation de navigateur, supporte désormais officiellement Firefox dès la version 23.
Cette avancée permet aux développeurs d'écrire des scripts d'automatisation et d'effectuer des tests de bout en bout sur Chrome et Firefox de manière interchangeable.
L'intégration de Firefox dans Puppeteer repose sur WebDriver BiDi, un protocole inter-navigateurs en cours de standardisation au W3C.
WebDriver BiDi facilite la prise en charge de plusieurs navigateurs et ouvre la voie à une automatisation plus simple et plus efficace.
Les principales fonctionnalités de Puppeteer, telles que la capture de journaux, l'émulation de périphériques, l'interception réseau et le préchargement de scripts, sont désormais disponibles pour Firefox.
Mozilla considère WebDriver BiDi comme une étape importante vers une meilleure expérience de test inter-navigateurs.
La prise en charge expérimentale de CDP (Chrome DevTools Protocol) dans Firefox sera supprimée fin 2024 au profit de WebDriver BiDi.
Bien que Firefox soit officiellement pris en charge, certaines API restent non prises en charge et feront l'objet de travaux futurs.

Guillaume a créé une annotation @Retry pour JUnit 5, pour retenter l'exécution d'un test qui est "flaky" https://glaforge.dev/posts/2024/09/01/a-retryable-junit–5-extension/

Guillaume n'avait pas trouvé d'extension par défaut dans JUnit 5 pour remplacer les Retry rules de JUnit 4
Mais sur les réseaux sociaux, une discussion intéressante s'ensuit avec des liens sur des extensions qui implémentent cette approche
Comme JUnit Pioneer qui propose plein d'extensions utiles https://junit-pioneer.org/docs/retrying-test/
Ou l'extension rerunner https://github.com/artsok/rerunner-jupiter
Arnaud a aussi suggéré la configuration de Maven Surefire pour relancer automatiquement les tests qui ont échoué https://maven.apache.org/surefire/maven-surefire-plugin/examples/rerun-failing-tests.html
la question philosophique est: est-ce que c'est tolerable les tests qui ecouent de façon intermitente

Architecture

Un ancien fan de GraphQL en a fini avec la technologie GraphQL et réfléchit aux alternatives https://bessey.dev/blog/2024/05/24/why-im-over-graphql/

Problèmes de GraphQL:
Sécurité:
Attaques d'autorisation
Difficulté de limitation de débit
Analyse de requêtes malveillantes
Performance:
Problème N+1 (récupération de données et autorisation)
Impact sur la mémoire lors de l'analyse de requêtes invalides
Complexité accrue:
Couplage entre logique métier et couche de transport
Difficulté de maintenance et de tests
Solutions envisagées:
Adoption d'API REST conformes à OpenAPI 3.0+
Meilleure documentation et sécurité des types
Outils pour générer du code client/serveur typé
Deux approches de mise en œuvre d'OpenAPI:
"Implementation first" (génération de la spécification à partir du code)
"Specification first" (génération du code à partir de la spécification)
retour interessant de quelqu'un qui n'utilise pas GraphQL au quotidien. C'était des problemes qui devaient etre corrigés avec la maturité de l'ecosysteme et des outils mais ca a montré ces limites pour cette personne.

Prensentation de Grace Hoper en 1980 sur le future des ordinateurs. https://youtu.be/AW7ZHpKuqZg?si=w_o5_DtqllVTYZwt

c'est fou la modernité de ce qu'elle décrit
Des problèmes qu'on a encore aujourd'hui
positive leadership
Elle décrit l'avantage de systèmes fait de plusieurs ordinateurs
récemment declassifié

Leader election avec les conditional writes sur les buckets S3/GCS/Azure https://www.morling.dev/blog/leader-election-with-s3-conditional-writes/

L'élection de leader est le processus de choisir un nœud parmi plusieurs pour effectuer une tâche.
Traditionnellement, l'élection de leader se fait avec un service de verrouillage distribué comme ZooKeeper.
Amazon S3 a récemment ajouté le support des écritures conditionnelles, ce qui permet l'élection de leader sans service séparé.
L'algorithme d'élection de leader fonctionne en faisant concourir les nœuds pour créer un fichier de verrouillage dans S3.
Le fichier de verrouillage inclut un numéro d'époque, qui est incrémenté à chaque fois qu'un nouveau leader est élu.
Les nœuds peuvent déterminer s'ils sont le leader en listant les fichiers de verrouillage et en vérifiant le numéro d'époque.
attention il peut y avoir plusieurs leaders élus (horloges qui ont dérivé) donc c'est à gérer aussi

Méthodologies

Guillaume Laforge interviewé par Sfeir, où il parle de l'importance de la curiosité, du partage, de l'importance de la qualité du code, et parsemé de quelques photos des Cast Codeurs ! https://www.sfeir.dev/success-story/guillaume-laforge-maestro-de-java-et-esthete-du-code-propre/

Sécurité

Comment crowdstrike met a genoux windows et de nombreuses entreprises https://next.ink/144464/crowdstrike-donne-des-details-techniques-sur-son-fiasco/

l'incident vient de la mise à jour de la configuration de Falcon l'EDR de crowdstrike https://www.crowdstrike.com/blog/falcon-update-for-windows-hosts-technical-details/
qu'est ce qu'un EDR? Un système Endpoint Detection and Response a pour but de surveiller votre machine ( access réseaux, logs, …) pour detecter des usages non habituels. Cet espion doit interagir avec les couches basses du système (réseau, sockets, logs systems) et se greffe donc au niveau du noyau du système d'exploitation. Il remonte les informations en live à une plateforme qui peut ensuite adapter les réponse en live
si l'incident a duré moins de 1h30 coté crowdstrike plus de 8 millions de machines se sont retrouvées hors service bloquées sur le Blue Screen Of Death selon Microsoft https://blogs.microsoft.com/blog/2024/07/20/helping-our-customers-through-the-crowdstrike-outage/
cela n'est pas la première fois et était déjà arrivé il y a quelques mois sur Linux. Comme il s'agissait d'une incompatibilité de kernel il avait été moins important car les services ITs gèrent mieux ces problèmes sous Linux https://stackdiary.com/crowdstrike-took-down-debian-and-rocky-linux-a-few-months-ago-and-no-one-noticed/

Les benchmarks CIS, un pilier pour la sécurité de nos environnements cloud, et pas que ! (Katia HIMEUR TALHI) https://blog.cockpitio.com/security/cis-benchmarks/

Le CIS est un organisme à but non lucratif qui élabore des normes pour améliorer la cybersécurité.
Les référentiels CIS sont un ensemble de recommandations et de bonnes pratiques pour sécuriser les systèmes informatiques.
Ils peuvent être utilisés pour renforcer la sécurité, se conformer aux réglementations et normaliser les pratiques.

Loi, société et organisation

Microsoft signe un accord avec OVHCloud pour qu'il arretent leur plaine d'antitrust https://www.politico.eu/article/microsoft-signs-antitrust-truce-with-ovhcloud/

la plainte était en Europe
mermet a des clients de plus facilement deployer les solutions Microsoft dans le fournisseur de cloud de leur choix
la plainte avait ete posé à l'été 2021
ca rendait faire tourner les solutions MS plus cheres et non competitives vs MS

ElasticSearch et Kibana sont de nouveau Open Source, en ajoutant la license AGPL à ses autres licences existantes https://www.elastic.co/fr/blog/elasticsearch-is-open-source-again

le marché d'il y a trois ans et maintenant a changé
AWS est une bon partenaire
le flou Elasticsearch vs le produit d'AWS s'est clarifié
donc retour a l'open source via AGPL Affero GPL
Elastic n'a jamais cessé de croire en l'open source d'après Shay Banon son fondateur
Le changement vers l'AGPL est une option supplémentaire, pas un remplacement d'une des autres licences existantes
et juste apres, Elastic annonce des resultants decevants faisant plonger l'action de 25% https://siliconangle.com/2024/08/29/elastic-shares-plunge–25-lower-revenue-projections-amid-slower-customer-commitments/
https://unrollnow.com/status/1832187019235397785 et https://www.elastic.co/pricing/faq/licensing pour un résumé des licenses chez elastic

Outils de l'épisode

MailMate un client email Markdown et qui gere beaucoup d'emails https://medium.com/@nicfab/mailmate-a-powerful-client-email-for-macos-markdown-integrated-email-composition-e218fe2accf3

Emmanuel l'utilise sur les boites email secondaires
un peu lent a demarrer (synchro) et le reste est rapide
boites virtuelles (par requete)
SpamSieve
Que macOS je crois

Trippy, un analyseur de réseau https://github.com/fujiapple852/trippy

Il regroupe dans une CLI traceroute et ping

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

17 septembre 2024 : We Love Speed - Nantes (France)
17–18 septembre 2024 : Agile en Seine 2024 - Issy-les-Moulineaux (France)
19–20 septembre 2024 : API Platform Conference - Lille (France) & Online
20–21 septembre 2024 : Toulouse Game Dev - Toulouse (France)
25–26 septembre 2024 : PyData Paris - Paris (France)
26 septembre 2024 : Agile Tour Sophia-Antipolis 2024 - Biot (France)
2–4 octobre 2024 : Devoxx Morocco - Marrakech (Morocco)
3 octobre 2024 : VMUG Montpellier - Montpellier (France)
7–11 octobre 2024 : Devoxx Belgium - Antwerp (Belgium)
8 octobre 2024 : Red Hat Summit: Connect 2024 - Paris (France)
10 octobre 2024 : Cloud Nord - Lille (France)
10–11 octobre 2024 : Volcamp - Clermont-Ferrand (France)
10–11 octobre 2024 : Forum PHP - Marne-la-Vallée (France)
11–12 octobre 2024 : SecSea2k24 - La Ciotat (France)
15–16 octobre 2024 : Malt Tech Days 2024 - Paris (France)
16 octobre 2024 : DotPy - Paris (France)
16–17 octobre 2024 : NoCode Summit 2024 - Paris (France)
17–18 octobre 2024 : DevFest Nantes - Nantes (France)
17–18 octobre 2024 : DotAI - Paris (France)
30–31 octobre 2024 : Agile Tour Nantais 2024 - Nantes (France)
30–31 octobre 2024 : Agile Tour Bordeaux 2024 - Bordeaux (France)
31 octobre 2024–3 novembre 2024 : PyCon.FR - Strasbourg (France)
6 novembre 2024 : Master Dev De France - Paris (France)
7 novembre 2024 : DevFest Toulouse - Toulouse (France)
8 novembre 2024 : BDX I/O - Bordeaux (France)
13–14 novembre 2024 : Agile Tour Rennes 2024 - Rennes (France)
16–17 novembre 2024 : Capitole Du Libre - Toulouse (France)
20–22 novembre 2024 : Agile Grenoble 2024 - Grenoble (France)
21 novembre 2024 : DevFest Strasbourg - Strasbourg (France)
21 novembre 2024 : Codeurs en Seine - Rouen (France)
27–28 novembre 2024 : Cloud Expo Europe - Paris (France)
28 novembre 2024 : Who Run The Tech ? - Rennes (France)
2–3 décembre 2024 : Tech Rocks Summit - Paris (France)
3 décembre 2024 : Generation AI - Paris (France)
3–5 décembre 2024 : APIdays Paris - Paris (France)
4–5 décembre 2024 : DevOpsRex - Paris (France)
4–5 décembre 2024 : Open Source Experience - Paris (France)
5 décembre 2024 : GraphQL Day Europe - Paris (France)
6 décembre 2024 : DevFest Dijon - Dijon (France)
22–25 janvier 2025 : SnowCamp 2025 - Grenoble (France)
30 janvier 2025 : DevOps D-Day #9 - Marseille (France)
6–7 février 2025 : Touraine Tech - Tours (France)
3 avril 2025 : DotJS - Paris (France)
16–18 avril 2025 : Devoxx France - Paris (France)

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs Faire un crowdcast ou une crowdquestion Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/

podCloud est en mode télécommande !

LCC 315 - les températures ne sont pas déterministes

Publié le mardi 17 septembre 2024 à 08:32 par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Aud

Durée : 1:50:08

Podcasts sur les mêmes thèmes