YiKe Blog

more is less


HHKB键盘与karabiner配置

简单改键 这里主要是改control alter option这些的映射 复杂改键 这个才是关键,这里主要KE-complex_modifications , 这里开源了很有用的配置,主要用Left ctrl + hjkl to arrow keys

百度网盘CLI使用

这里主要给 bypy-命令行下使用百度网盘 做一点补充。 这里这个CLI其实是写死了一个工作路径,这个对应网盘里/app/bypy 但是有个比较坑的是,再根目录,显示的是中文alias “我的应用数据”, 这让大家使用时候根本找不对路径。 所以,需要把要下载的东西放在这个路径下面,然后 bypy list 就可以看到了。

chatglm tuning 实战

今天跑了一下这个chatglm tuning 记录下遇到的问题 网络问题 ssl 要么是公司信任机制问题,要么是huggingface的证书问题,反正会verify失败。只能跳过认证。 1 2 import os os.environ['CURL_CA_BUNDLE'] = '' 这里直接把CA置为空,把验证过程给阻断了 timeout 模型稳健非常大,如果一直hang,就会t...

嵊泗客运抢票

背景 这个五一是疫情后得第一个五一,出行人数真的恐怖,早早定了嵊泗得酒店(不退款),提前7天开始抢船票,但是早起来抢都铩羽而归,只能写个脚本抢了。最后,结果还是好的 ,抢到了合适得班次。 代码 代码里有些隐私信息替换成了”**” 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3...

textrank

textrank 得思想来自pagerank,或者来自graph, 区别是pagerank得边是web之间引用,但是nlp里得edge怎么取? 关键词提取–“这个词总出现,属于是关键词了” 这个任务里,通过词语的在窗口里得共现来表示edge summary– “句句扣主题,那这个句子可以当中心语句” 用句子之间得相似度来当edge(相...

经典回顾pagerank

动机 让重要得网页,排在前面。btw, 怎么算重要? 定义一个rank值,跟引用有关 “群众得眼睛是雪亮得”=> 把大家的rank值用加起来 “大V引用,权重更大”=> 每个人都有个rank值,大v得更大 “有的大v就爱转发”=> 把rank值divide 示例 得到(a,y,m)=(2/5, 2/5,1/5) algo 按上面示例进行方程组求解,如果节点太多就不wor...

通过对标签表征进行微调的深度学习新范式

ACL2022有一篇名为《$\mathcal{Y}$-Tuning: An Efficient Tuning Paradigm for Large-Scale Pre-Trained Models via Label Representation Learning》的投稿,从标题上就吸引了我的注意,不同于Fine-Tuning、Adapter-Tuning、Prompt-Tuning,这篇文...

长尾分布的多标签文本分类平衡方法

长尾分布各位肯定并不陌生,指的是少数几个类别却有大量样本,而大部分类别都只有少量样本的情况,如下图所示 长尾分布:少数类别的样本数量非常多,多数类别的样本数目非常少 通常我们讨论长尾分布或者是文本分类的时候只考虑单标签,即一个样本只对应一个标签,但实际上多标签在实际应用中也非常常见,例如个人爱好的集合一共有6个元素:运动、旅游、读书、工作、睡觉、美食,一般情况下,一个人的爱好有这其中...

Child Tuning: 反向传播版的 Dropout

这篇文章主要是对EMNLP2021上的论文Raise a Child in Large Language Model: Towards Effective and Generalizable Fine-tuning进行讲解。论文标题有些抽象,但是用作者的话来说,这篇论文的思想可以归结为两个词:Child Tuning 虽然这篇文章主要针对NLP任务以及NLP相关的模型,但实际上我看完之后觉...