YiKe Blog

more is less

Posted by YiKe on June 3, 2024

HHKB键盘与karabiner配置

简单改键这里主要是改control alter option这些的映射复杂改键这个才是关键，这里主要KE-complex_modifications , 这里开源了很有用的配置，主要用Left ctrl + hjkl to arrow keys

Posted by YiKe on June 2, 2023

百度网盘CLI使用

这里主要给 bypy-命令行下使用百度网盘做一点补充。这里这个CLI其实是写死了一个工作路径，这个对应网盘里/app/bypy 但是有个比较坑的是，再根目录，显示的是中文alias “我的应用数据”，这让大家使用时候根本找不对路径。所以，需要把要下载的东西放在这个路径下面，然后 bypy list 就可以看到了。

Posted by YiKe on May 10, 2023

chatglm tuning 实战

今天跑了一下这个chatglm tuning 记录下遇到的问题网络问题 ssl 要么是公司信任机制问题，要么是huggingface的证书问题，反正会verify失败。只能跳过认证。 1 2 import os os.environ['CURL_CA_BUNDLE'] = '' 这里直接把CA置为空，把验证过程给阻断了 timeout 模型稳健非常大，如果一直hang,就会t...

Posted by YiKe on May 3, 2023

嵊泗客运抢票

背景这个五一是疫情后得第一个五一，出行人数真的恐怖，早早定了嵊泗得酒店（不退款），提前7天开始抢船票，但是早起来抢都铩羽而归，只能写个脚本抢了。最后，结果还是好的，抢到了合适得班次。代码代码里有些隐私信息替换成了”**” 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3...

Posted by YiKe on April 26, 2023

textrank

textrank 得思想来自pagerank,或者来自graph, 区别是pagerank得边是web之间引用，但是nlp里得edge怎么取？关键词提取–“这个词总出现，属于是关键词了” 这个任务里，通过词语的在窗口里得共现来表示edge summary– “句句扣主题，那这个句子可以当中心语句” 用句子之间得相似度来当edge（相...

Posted by YiKe on June 3, 2022

经典回顾pagerank

动机让重要得网页，排在前面。btw, 怎么算重要？定义一个rank值，跟引用有关 “群众得眼睛是雪亮得”=> 把大家的rank值用加起来 “大V引用，权重更大”=> 每个人都有个rank值，大v得更大 “有的大v就爱转发”=> 把rank值divide 示例得到（a,y,m）=(2/5, 2/5,1/5) algo 按上面示例进行方程组求解，如果节点太多就不wor...

Posted by YiKe on March 3, 2022

通过对标签表征进行微调的深度学习新范式

ACL2022有一篇名为《$\mathcal{Y}$-Tuning: An Efficient Tuning Paradigm for Large-Scale Pre-Trained Models via Label Representation Learning》的投稿，从标题上就吸引了我的注意，不同于Fine-Tuning、Adapter-Tuning、Prompt-Tuning，这篇文...

Posted by YiKe on December 13, 2021

长尾分布的多标签文本分类平衡方法

长尾分布各位肯定并不陌生，指的是少数几个类别却有大量样本，而大部分类别都只有少量样本的情况，如下图所示长尾分布：少数类别的样本数量非常多，多数类别的样本数目非常少通常我们讨论长尾分布或者是文本分类的时候只考虑单标签，即一个样本只对应一个标签，但实际上多标签在实际应用中也非常常见，例如个人爱好的集合一共有6个元素：运动、旅游、读书、工作、睡觉、美食，一般情况下，一个人的爱好有这其中...

Posted by YiKe on November 19, 2021

Child Tuning: 反向传播版的 Dropout

这篇文章主要是对EMNLP2021上的论文Raise a Child in Large Language Model: Towards Effective and Generalizable Fine-tuning进行讲解。论文标题有些抽象，但是用作者的话来说，这篇论文的思想可以归结为两个词：Child Tuning 虽然这篇文章主要针对NLP任务以及NLP相关的模型，但实际上我看完之后觉...

Posted by YiKe on November 8, 2021