踩坑日记[生信等][2024]

2.4k 词

scRNA-seq(R)

[2024-07-25]Rstudio server的Python venv配置

有时候安装设置完之后即使看到配置成功了,但是还是无效,试着重启一下吧。

[2024-12-15]Read10x()在Seurat V5中新功能的表现(多数据库报错)

在V5中,Read10x()可以读取一个目录的列表,直接整合成一个表达矩阵,但是实测在遇到基因没法对应的多个样本时会报Error in cbind.Matrix(x, y, deparse.level = 0L) : number of rows of matrices must match,还会卡住。
并且运行速度慢于lapply()分别读取(虽说这样还要mergeJoinLayers吧),还会产生没法回收的内存垃圾。

[2024-12-15]Read10x()在Seurat V5中新功能的表现(多数据库报错)

在V5中,Read10x()可以读取一个目录的列表,直接整合成一个表达矩阵,但是实测在遇到基因没法对应的多数据库时会报Error in cbind.Matrix(x, y, deparse.level = 0L) : number of rows of matrices must match,还会卡住。
并且运行速度慢于lapply()分别读取(虽说这样还要mergeJoinLayers吧),还会产生没法回收的内存垃圾。

[2024-12-17]基因ID转换

从前用的org.Hs.eg.db之类的,但是他们的转换率不太行。
换用biomaRt,但是注意,举例来说,biomRt不仅会扔掉一些没法识别的ENSEMBL,还会把一些转换成NA,一些转换成"",需要特殊处理一下。

[2024-12-16]去污染的重要性

当感觉快寄了的时候,不妨试试decontX之类的。

[2024-12-17]seurat V5获取表达矩阵的方式

在V5中,object@assays$RNA@layers$counts获取到的数据没有行名和列名,跑decontX没问题,但是copyKAT之类的就不行,可以用GetAssayData(object[["RNA"]], layer = "counts")获取。

[2024-12-17]inferCNV注意事项

  • 参考太大或许会造成run()卡在绘图上,可以设置no_plot = TRUE不出图。
  • 但是设置不出图的话,infercnv.observations.txt之类的文件也不出了(令人惊喜),可以设置write_expr_matrix = TRUE输出。如果要补救不想重跑,可以读取[email protected]
  • inferCNV每次运行都会检查输出目录里是否存在之前跑的文件并读取跳过(infercnv/issues#183)。

杂项

[2024-11-28]DeepLabCut不更新.\training-datasets\iteration-0\UnaugmentedDataSet_projectName\metadata.yaml

在仅有pytorch的本地标注好训练集之后手贱创建训练集出shuffle0,之后在仅有tensorflow服务器上以默认参数再创建一次就会出现shuffle1,而metadata.yaml不会更新,服务器上训练没问题,但此时再回本地推理就会找不到实际上使用的shuffle。

[2024-12-15]conda镜像源配置

一般说是

1
2
3
4
5
6
7
8
9
10
channels:
- defaults
show_channel_urls: true
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
但是不行,根据tuna/issues#985,直接改成
1
2
3
4
5
6
7
8
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
show_channel_urls: true
成功。

[2024-12-15]BiocManager镜像源设置

网络没问题,旧版本BiocManager要么慢死,要么镜像url不对,怎么啥都安不上呢,看报错似乎是镜像的问题。
tuna/issue#1969,好好好,降本增效。
两种办法:

  • 更新R和BiocManager的版本
  • 使用西湖大学的镜像options(BioC_mirror="https://mirrors.westlake.edu.cn/bioconductor")