07:30 <NelleV> je suppose qu'il n'y a personne ici, à cette heure là, mais ça vous dirait de commencer à pyconfr ?
07:31 <NelleV> de commencer à penser à*
08:59 <misc> NelleV: tu es bien matinale
09:24 <feth> matin
10:57 <ogrisel> yota l'est pas la?
10:58 <ogrisel> est ce que y a pizza avant l'atelier git ou pas ?
11:13 <NelleV> ogrisel: salut
11:13 <NelleV> ogrisel: j'ai des questions pour toi
11:14 <ogrisel> yo
11:14 <NelleV> j'ai besoin de faire tourner un kmeans sur 1.6M points, sur des descripteurs de 328floats, avec k=10000
11:14 <ogrisel> hum
11:14 <ogrisel> c'est le k=10000 qui fait mal
11:14 <NelleV> uep...
11:15 <NelleV> ça a du sens de faire tourner ça avec des batch size de 2000 ?
11:15 <NelleV> (je prends le MiniBatch)
11:15 <ogrisel> je sais pas trop pour la size du batch
11:16 <NelleV> (ironiquement, dans l'article, ils se vantent de pouvoir faire tourner le matching en gardant tout en ram sur une machine "normale"... Ils oublient de préciser qu'il est impossible de faire tourner les parties de création d'index avant...)
11:16 <NelleV> bon, je vais tenter pour voir ce que ça donne
11:16 <ogrisel> utilise cette branche: https://github.com/ogrisel/scikit-learn/tree/minibatch-kmeans-optim
11:16 <NelleV> ogrisel: ok
11:17 <ogrisel> faut que je la finisse et que je la pull request mais ca ira deja plus vite et ca prendra moins de memoire
11:17 <alain_afpy> WARNING !!! YAKAFOKON DETECTED !!!!
11:17 <ogrisel> hahaha
11:17 <ogrisel> alain_afpy: t'es trop con, j'ai dit "il faut que je" et non pas "il faut qu'on"
11:17 <alain_afpy> WARNING !!! YAKAFOKON DETECTED !!!!
11:17 <alain_afpy> ogrisel: espèce de sale amateur de beaujolais nouveau
11:18 <ogrisel> c'est pas completement faut
11:18 <ogrisel> alain_afpy: le jour ou tu parse et interprete les modalité du discours direct ou indirect on en reparle
11:18 <alain_afpy> ogrisel: haïku
11:19 <ogrisel> et je te paierai un beaujolais
11:19 <NelleV> ogrisel: c'est un projet comme un autre :)
11:20 <ogrisel> t'es sure que tu as besoin de 10000 centers ?
11:20 <NelleV> l'article me dit que j'ai besoin de 10k de centroids...
11:20 <ogrisel> ca me parait beaucoup
11:20 <NelleV> c'est pour un algo de vision
11:20 <ogrisel> c'est pour quel type de data ?
11:20 <NelleV> des descripteurs d'image
11:20 <ogrisel> c'est quoi les 328 features ?
11:21 <ogrisel> ok
11:21 <ogrisel> faudrait probablement un clustering hierarchique idealement en plus, non ?
11:21 <NelleV> pour l'instant je fais tourner avec beaucoup moins, sur une base d'image incomplète, mais la partie moteur de recherche marche pas super du coup
11:21 <ogrisel> alain_afpy: tu sais pas conjuguer le verbe falloir? tu me decois
11:21 <alain_afpy> ogrisel: nous nous méfions de quinze halos.
11:22 <NelleV> uep, c'est ce à quoi je pensais...
11:22 <ogrisel> ok
11:22 <NelleV> ogrisel: je pourrais facilement faire un kmeans hierarchique "à la main" sans trop impacter les résultats je pense
11:22 <ogrisel> oui ca vaut le coup de tenter je pense
11:23 <ogrisel> premier niveau 100 clusters * 100 clusters au second niveau
11:23 <NelleV> ça me casse les pieds à donf, ce projet... Mon ordi passe plus de temps à bosser que moi
11:23 <ogrisel> avec mblondel on compte bosser sur tu soft-kmeans aussi
11:23 <ogrisel> kmeans avec plusieurs assignements par samples
11:24 <ogrisel> ca matche mieux la notion de topics pour des documents dans du texte
11:24 <NelleV> mmh, ça serait pas mal pour les trucs de vision du coup
11:24 <NelleV> je pense...
11:24 <ogrisel> y a des chance que ce soit bien pour transformer des descripteurs d'image en des features de plus haut niveau aussi
11:24 <ogrisel> yes
11:24 <ogrisel> pour l'instant j'ai rien fait la dessus
11:24 <ogrisel> mblondel fait la partie math :)
11:25 <NelleV> j'ai que 5 jours pour terminer le projet donc je ne l'utiliserais pas pour celui-ci :)
11:29 <ogrisel> oui non je me doute bien
11:29 <ogrisel> c'est juste pour info au cas ou tu ais a faire le meme genre de trucs
11:29 <NelleV> ogrisel: vous allez bosser dessus pendant le code sprint ?
11:30 <ogrisel> donc pour resumer tente un MinibatchKMeans avec 10k centers et 10k batch_size et un autre avec 2k batch_size
11:30 <ogrisel> et regarde la vitesse de convergence
11:30 <NelleV> en fait, le code de ce projet est relativement propre pour l'instant (ça risque de ne pas durer), donc je le mettrais peut être à jour une fois le softkmeans fait
11:30 <ogrisel> dans ma branche, en verbose elle doit etre normalisée
11:31 <NelleV> ogrisel: 2k batch size, en 4h il avait fait 1/4 des iterations
11:31 <NelleV> j'ai du éteindre mon pc avant qu'il finisse.
11:31 <ogrisel> ensuite fait un 2 levels kmeans: level 1: 1 partition * 100 centers + level2: 100 partitions * 100 centers
11:32 <ogrisel> NelleV: passe en mode verbose dans ma branche et regarde la tronche de l'inertia
11:32 <ogrisel> j'ai implémenté un early stopping
11:32 <NelleV> ogrisel: ok. Je finis mes tests avec 1/10 des images avant de le lancer à nouveau
11:32 <ogrisel> ok
11:33 <ogrisel> le 2 levels kmeans est parallelisable pour le second niveau
11:33 <ogrisel> avec joblib
11:35 <feth> rha, ce highlight sur "elisa" me tuera
11:38 <NelleV> ok
11:38 <NelleV> merci beaucoup !
11:57 <yota> yop
11:58 <yota> si des gens veulent bouffer avant l'atelier, je serai a SA vers 13h
11:58 <yota> ogrisel me parlait d'une pizzeria, celle au 13 rue Saint Lazare, a 10mn de SA est pas mal
12:06 <yota> bon bah j'y go
12:17 <NelleV> ogrisel: j'en profite puisque tu es là
12:18 <ogrisel> ou presque
12:18 <NelleV> ogrisel: pour le scikit, a la place d'avoir des rapports pep8, avec jenkins, c'est possible de mettre des rapports flake8 ?
12:18 <ogrisel> :)
12:18 <NelleV> c'est un peu plus extremiste, mais je trouve les rapports flake aussi important que ceux de pep8
12:18 <ogrisel> alain va etre content
12:18 <ogrisel> il faut qu
12:18 <alain_afpy> WARNING !!! YAKAFOKON DETECTED !!!!
12:18 <NelleV> ça permettrait d'avoir les deux :D
12:18 <ogrisel> voala
12:18 <ogrisel> tu veux un login admin NelleV sur jenkins?
12:19 <ogrisel> ah non je confond: c'est pylint qui est supporté par jenkins
12:19 <ogrisel> y a pas pyflake
12:19 <ogrisel> mais bon c'est bien aussi
12:20 <ogrisel> faut "juste" avoir un fichier de conf de pylint qui match bien nos conventions de projet
12:21 <yota> Re
12:21 <NelleV> ogrisel: je n'utilise pas trop pylint, mais je peux y jeter un coup d'oeil pendant le code sprint (ie, quand j'aurais fini mes 3 projets et 2 dms)
12:24 <ogrisel> hehe
12:26 <ogrisel> en fait flake8 fait une erreur par ligne
12:26 <ogrisel> donc on peut tres bien l'utiliser avec le plugin pep8 de jenkins
12:26 <ogrisel> bonne idee
12:26 <ogrisel> yota: salut
12:27 <ogrisel> NelleV: tu veux que je te donne les droit d'admin sur quelle adresse email?
12:27 <ogrisel> gmail?
12:27 <NelleV> ogrisel: uep stp
12:27 <NelleV> (j'en ai une autre ?)
12:28 <yota> Yop
12:28 <NelleV> ogrisel: a priori, flake8 fonctionne que pep8
12:28 <ogrisel> c'est parti
12:28 <NelleV> ogrisel: d'ailleurs, je l'utilise dans vim: il me fait un rapport a chaque fois que je sauve. C'est assez génial :)
12:28 <NelleV> (je sens que mon frangin va adorer la prochaine qu'il utilisera mon pc)
12:28 <ogrisel> hehe
12:29 <ogrisel> il pourra plus faire de `x**2`
12:29 <ogrisel> c'est horrible
12:29 <ogrisel> x**2
12:46 <ogrisel> yota: l'atelier c'est a 62 rue de la Chaussée d'Antin ?
12:46 <ogrisel> tu essayais de m'induire en erreur sur twitter?
12:49 <yota_> ogrisel: ?
12:49 <ogrisel> yota_: sur twitter tu m'as dit 13 rue St Laz
12:50 <yota_> la pizzeria
12:50 <yota_> c'est l'adresse d'une pizzeria
12:50 <ogrisel> ah ok donc on fait pizza ou c'est trop tard
12:50 <yota_> je suis au taff la
12:50 <ogrisel> il me faut bien 40 min je pense
12:50 <yota_> donc c'est ok pour moi
12:50 <yota_> faut juste me dire d'attendre et de ne pas manger :à
12:50 <yota_> :)
12:51 <ogrisel> il est ou le doodle avec la liste des participants
12:51 <ogrisel> pour pinger des gens qui voudraient se faire un pizz avant de giter
12:51 <yota_> c'est sur la ml
12:52 <yota_> http://www.doodle.com/iah4cf2hye5kqb3a
12:58 <ogrisel> ronnix, gawel, NelleV: pizza ou pas ?
12:58 <ogrisel> il faut peut etre inviter alain_afpy aussi
12:58 <ogrisel> il faut que j'invite alain_afpy?
12:58 <alain_afpy> WARNING !!! YAKAFOKON DETECTED !!!!
12:58 <ogrisel> ah
12:59 <ogrisel> NelleV: tu viens faire du git ou tu fais du kmeans a la place?
13:00 <gawel> moi je viens de me réveiller, c'est tendu. si c'est pizza à 14h, ça me va
13:01 <gawel> (et encore j'avais prévu de me recoucher)
13:03 <ogrisel> haha
13:03 <ogrisel> pizza 14h yota_?
13:03 <ogrisel> ou c'est trop tard?
13:06 <yota_> euh
13:06 <yota_> tard
13:06 <yota_> pour etre la vers 14h45
13:07 <ogrisel> ok donc on se retrouve direct a securactive alors
13:07 <ogrisel> a tte
13:07 <NelleV> ogrisel: je suis coincée ici là... Mon binome n'est pas aussi efficace que j'aimerais sur ce projet, ce qui me rajoute un peu de taff
13:10 <ogrisel> ok
13:10 <ogrisel> bon courage
13:14 <gawel> y a peut-être moyen que je sois la pour 13h45
13:18 <ogrisel> ca va etre trop tard pour moi du coup :)
13:19 <gawel> bon
13:20 <NelleV> j'en ai marre...
13:20 <gawel> je parlais pas de toi, NelleV
13:21 <gawel> c'est une vrai quiche, j'ai faim
13:21 <NelleV> gawel: tupeux me terminer mon dm stp ?
13:21 <NelleV> c'est pas sensé être dur -__-'
13:21 <gawel> tout dépends du sens de dm
13:22 <gawel> si c'est un diner maison, oui, je peux
13:22 <NelleV> presque
13:22 <NelleV> mais pas tout à fait
13:22 <NelleV> gawel: 50% juste, c'est pas si mal que ça :p
13:22 <gawel> c'est quoi le menu ?
13:22 <NelleV> gawel: des k plus proches voisins, là pour l'instant
13:23 <Grahack> NelleV: DM de quoi ?
13:23 <NelleV> bon... je crois que je vais aller prendre un ou deux verres de vin pour faire passer ça
13:23 <Grahack> bonjour au fait
13:23 <NelleV> Grahack: object retrieval
13:24 <gawel> je vois que tu n'a pas de voisines, toi non plus
13:24 <NelleV> Grahack: là, en ce moment, il s'agit "simplement" de faire du matching. Il faut que j'extrais les plus proches voisins, et les deuxièmes plus proches voisin pour faire un ratio des deux, et trouver des matchs potentiels
13:24 <alain_afpy> WARNING !!! YAKAFOKON DETECTED !!!!
13:24 <NelleV> alain_afpy: rho...
13:24 <alain_afpy> NelleV: non
13:24 <NelleV> bon, je vais manger. A plus
13:31 <ronnix> j'en peux plus des pizzas. pas digéré celles de Microsoft au ParisJS :(
13:32 <gawel> c'est le js que t'as pas digéré, avoue
13:33 <ronnix> :)
13:33 <ronnix> un mélange de tout ça sans doute
13:41 <gawel> yota_: tu sera yotaff à quelle heure ?
13:41 <gawel> tu paye le café ?
13:41 <yota_> je suis deja au taff
13:42 <gawel> ah
13:42 <gawel> je pouvais pas le deviner, t'as pas ton pseudo de taf
13:47 <gawel> tu te réveilles, ccomb ?
13:47 <ccomb> nonon
13:47 <ccomb> je vais pas tarder à partir
13:48 <gawel> pas moi
13:48 <ccomb> pfff tu vas meme pas venir
13:48 <gawel> si, à 14h01, pour faire chier yota_
13:48 <ccomb> haha
13:49 <gawel> fait chier que ce soit mouiller, je serais bien venu en skate :(
13:50 <ccomb> t'as pas des pneus pluie ?
13:50 <gawel> c'est le genre de trajet que tu fais en 10mn en skate et en 45mn avec 3 changement de métro
13:50 <gawel> nope