更换Colab的Python版本

2025-03-11

杂谈

1.5k 词

引言 Colab团队十分自负x，除了在更新Python版本时提供上一个版本的Python，目前没有使用3.11以外版本的选项。但是有一些包可能不支持特定的Python版本，这就麻烦大了。主要参考这个回答，目前能够成功降级。更换Python版本这里选择降级到Python3.9。在提示重启的时候重启。 12345678910111213141516171819!sudo apt-get update -y!sudo apt-get install python3.9!sudo apt-get install python3.9-distutils!sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.9 1!sudo update-alternatives --config python3# 假如知道要选择的版本，可以直接选择# !echo 3 | sudo update-alternatives --config python3!apt-get install...

一种通过steam用手柄模拟速度可调的鼠标滚轮的方法

2025-03-04

杂谈

365 词

主要用于桌面模式。方法A 核心是摇杆-右摇杆行为设置为十字键，设置里选择模拟信号模拟、模拟信号模拟脉冲时间：500，然后比如上键设置为滚轮上（长按），下键设置为滚轮下（长按），设置里选按住以重复：开启、按压时间：0ms、重复速度：40，这个速度调小的话，实际的速度会增加。做好的布局在这里方法B 如果嫌不够快、不够灵敏，还有一种方法：摇杆-右摇杆行为设置为十字键，设置里选择模拟信号模拟，然后比如上键设置为滚轮上，下键设置为滚轮下，设置里选普通按压、按住以重复。但是这样设置出来，轻推是高速滚动，全推是低速滚动QAQ 我想机制和全推时频率更高，每个脉冲时间更短有关。如果能搞到源码看一下就好了。后记：手柄模拟常用鼠标键盘功能的键位见L4T的默认键位，我就说左摇杆光标、右摇杆滚轮这种思路才是最好的，steam默认是什么反人类键位（确信）

基因富集分析（SPIA）

2025-02-22

生信

3.1k 词

引言一般来说，使用GO和KEGG数据库对差异基因进行基因富集分析，多是 ORA：基于对特定组内外（如通路）的差异基因、背景基因数量进行检验，看组内外的差异基因是否随机分布。比如ClusterProfiler包中的enrichGO()和enrichKEGG() GSEA：差异基因按log2FoldChange降序排序后，顺序遍历，按差异基因是否在特定组（如通路）内进行加减分，并进行检验，最后NES可以看出组内的整体表达趋势。比如同样是ClusterProfiler包中的gseGO()和gseKEGG() GO数据库条目之间至少可能还有Positively regulates和Negatively regulates两种关系，暂且不论。但KEGG一个通路内的基因，极度简化，既有正向的也有负向的，而且还有更复杂的，有一些使用KEGG数据库的做法是把上下调的差异基因分别进行ORA，或者一起进行GSEA，仔细想想其实很没道理。以GSEA举例，如果一个通路内正向的基因上调，负向的基因下调，这样子整体表达趋势却可能是不变，会认为不显著。（GSEA针对这个问题，有一种...

对小鼠脑组织进行空间转录组学分析

2025-02-17

生信

5.3k 词

引言附：基于barcode的空转原理把特定barcode结合到特定位置，其末端是可以与mRNA结合的polyT序列。将切片透化，让其mRNA与barcode结合，在原位合成cDNA，通过NGS就能得到每个mRNA和其barcode，通过barcode又能映射回其位置。相较于其它方法，这种方法的优势在于同时兼顾速度、精度和全转录组测序等。在精度上，基于FISH和原位测序的方法可以做到光学极限，但就没法做到全转录组了。数据分析那么这里使用的数据是通过基于barcode的空转测序得到的。和scRNA-seq比起来，就是每个样本点有了空间信息，并且每个样本点是一群细胞，那么要做的和之前的十分相似，只是主要有以下不同：寻找差异表达基因时，有2种手段聚类后在簇之间寻找，不需要空间信息根据空间信息寻找进行类型注释时，有2种手段寻找和scRNA-seq之间的锚点，然后整合，每个spot只能预测出1种细胞类型使用scRNA-seq作为参考，对每个spot进行反卷积，能得到每个spot内不同类型的比例在这个示例里，都采用前者...

对PBMC进行scATAC-seq分析

2025-02-13

生信

6k 词

ATAC-seq的原理可以通过这个视频简单了解，在染色质开放区域，转座事件更容易发生，产生更多片段，形成peak。通过scATAC-seq分析，我们可以得出，例如，不同条件下染色质开放区域的差异，高度开放区域可能为活跃转录的基因。这里使用Seurat V5和signac对PBMC进行scATAC-seq分析，原始代码见signac文档。数据导入 peak-细胞计数矩阵元数据片段信息这个片段信息结构是，染色体-起始位置-终止位置-barcode等片段信息索引 scRNA-seq数据（所以其实，可以只用片段信息来生成peak-细胞计数矩阵。）还可以添加注释信息，便于下游分析直接从对象中读取。生成Seurat对象 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950pkgs <- c("Signac", "Seurat", "hdf5...

ML入门

2025-01-31

Coding

8k 词

线性回归引言在中学就学习过，一元线性回归中，对于某组常数项和回归系数，有评价标准使用最小二乘法（正规方程）可以使其最小，此时多元线性回归损失函数类似地，多元线性回归中，对于个样本的个特征以及一组回归系数，有相同的评价标准，为了去掉样本规模的影响除以，定义损失函数正规方程同样可以使用正规方程，求解使得最小。标量对向量的求导方法或依据和形式一致（Denominator Layout）或和形式一致（Numerator Layout）而定，以下采用Denominator Layout。于是我们有（或者说，，则）进一步地，对于二次型于是所以这也就是雅可比矩阵。二阶导上面直接认定了代价函数有最小值，在这里我们可以向量对向量求导求海森矩阵（因为连续函数偏导和求导顺序无关，其海森矩阵是对称矩阵）而对于任意非零实列向量，的特征值（内积）所以是凸函数令，若可逆，有带回到一元线性回归对于和上文一致。梯度下降法就是让某组不...

在UEFI+GPT的windows+linux双系统中卸载Linux

2025-01-19

杂谈

636 词

前言之前看到好多人说自己卸载win+linux双系统的linux之后，启动项、引导之类的都坏了，但是在了解UEFI+GPT和Legacy+MBR的区别后，如果自己的双系统是在UEFI引导模式+GPT分区表格式的，那不用担心，出问题的多是Legacy+MBR。 UEFI+GPT UEFI+GPT需要一个存放引导启动文件的fat分区，名字可能叫做ESP、System_DRV、EFI等，我的这个分区下面还有一个EFI目录，里面是windows和debian的引导文件。而另外装系统的分区就只有系统而已。 Legacy+MBR Legacy+MBR在最前面的一段引导扇区中描述了分区引导信息（MBR），grub可能会安装到MBR里（安装win时也会覆盖进去）。这种情况下，引导顺序是MBR->grub->linux boot数据->用户选择，所以直接删掉linux之后，grub就会出错。所以还需要修复MBR。 UEFI+GPT卸载Linux流程确定自己的模式是UEFI+GPT UEFI这个在bios里就能看到，或者运行msinfo32，在系...

一些胡思乱想

2025-01-04

杂谈

3.8k 词

将二元数映射到一元数给定一个二元数，其中的整数部分依次为数列，小数部分依次为数列，同理的整数部分为数列，小数部分为数列。可以构造出与其唯一对应的一元数：的整数部分有一分隔标记，其左方为逆序的数列，右方为正序的数列，小数部分同理。（内心OS：这样二元数不就和一元数一样多了么（没学好）结果还真一样多，别人的构造方法还漂亮多了：小数部分的第位为，第位为，整数部分同理。证明：有无穷多个质数给定质数，构造，再构造，则除以中任意一个数都余，并且大于中任意一个数包括，所以要么是质数，要么有一个大于的质因数。所以对于任意质数，都存在一个比它大的质数。（好像是阿基米德的方法） SpinLaunch的角动量问题如上00:25说：发射器一端圆盘的近端慢于远端，所以圆盘释放时会带有角动量，听起来很符合直觉。这或许也是SpinLaunch（怎么logo像厕纸一样）面临的问题之一，下面对这个问题进行定量分析。假设发射器角速度为，均质等厚圆盘中心到发射器轴的距离为，圆盘半径为，密度为。那么，以发射器轴为中心画圆弧分割，为圆盘某点与圆心的距离，为此连...

踩坑日记[生信等][2024]

2024-12-30

生信>踩坑日记

2.2k 词

scRNA-seq(R) [2024-07-25]Rstudio server的Python venv配置有时候安装设置完之后即使看到配置成功了，但是还是无效，试着重启一下吧。 [2024-12-15]Read10x()在Seurat V5中新功能的表现（多数据库报错）在V5中，Read10x()可以读取一个目录的列表，直接整合成一个表达矩阵，但是实测在遇到基因没法对应的多个样本时会报Error in cbind.Matrix(x, y, deparse.level = 0L) : number of rows of matrices must match，还会卡住。并且运行速度慢于lapply()分别读取（虽说这样还要merge、JoinLayers吧），还会产生没法回收的内存垃圾。 [2024-12-17]基因ID转换从前用的org.Hs.eg.db之类的，但是他们的转换率不太行。换用biomaRt，但是注意，举例来说，biomRt不仅会扔掉一些没法识别的ENSEMBL，还会把一些转换成NA，一些转换成""，需要特殊处理一下。 [2024-...

所谓“海关商品溯源”系统简析

2024-12-28

杂谈

362 词

引言最近购买了某商品，其上贴有所谓“海关商品溯源”系统贴纸，使用方法大致如下：扫描二维码获取url进入系统输入涂层下口令的末位并验证但是发现其url包含了所需输入口令的一部分，也就是说它本来就藏在二维码中。尝试更改url，即可构造出任意密码皆可查询成功的url。并且可以更改成使原密码无效的url。简析查询界面url结构为通用段A+口令末位，服务器根据此返回整个口令，为通用段B+口令末位。其查询过程即为发送参数包含口令以及输入口令末位的请求，服务器应该是直接根据参数是否匹配返回结果，同时返回的还有此参数的查询次数。但是通用段不可任意更改，某些值会导致查询失败。结论那就有几个可能：这是设计给假货的盗版系统这是外包给哪个大学生做的系统但是东西用着感觉和以前一样，这个系统好像也和以前官方买的一样...... 根本不一样啊喂！

分类

标签