代码之家 › 专栏 › 技术社区 › Nikita Vlasenko

如何确定在python脚本中的哪一点SLURM中超出了step内存

slurm memory python

Nikita Vlasenko · 技术社区 · 6 年前

我有一个 python 我正在运行的脚本 SLURM

#!/bin/bash

#SBATCH -p standard
#SBATCH -A overall 
#SBATCH --time=12:00:00
#SBATCH --output=normalize_%A.out
#SBATCH --error=normalize_%A.err
#SBATCH --nodes=1
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=20
#SBATCH --mem=240000

HDF5_DIR=...
OUTPUT_DIR=...
NORM_SCRIPT=...

norm_func () {
  local file=$1
  echo "$file"
  python $NORM_SCRIPT -data $file -path $OUTPUT_DIR
}

# Doing normalization in parallel
for file in $HDF5_DIR/*; do norm_func "$file" & done
wait

python脚本只是加载一个数据集( scRNAseq .csv 文件。其中的一些主要代码行包括:

        f = h5py.File(path_to_file, 'r')
        rawcounts = np.array(rawcounts)

        unique_code = np.unique(split_code)
        for code in unique_code:
            mask = np.equal(split_code, code)
            curr_counts = rawcounts[:,mask]

            # Actual TMM normalization
            mtx_norm = gmn.tmm_normalization(curr_counts)

            # Writing the results into .csv file
            csv_path = path_to_save + "/" + file_name + "_" + str(code) + ".csv"
            with open(csv_path,'w', encoding='utf8') as csvfile:
                writer = csv.writer(csvfile, delimiter=',')
                writer.writerow(["", cell_ids])
                for idx, row in enumerate(mtx_norm):
                    writer.writerow([gene_symbols[idx], row])

step memory exceeded 以上数据集出错 10Gb .slurm 脚本或 python memory 问题是,在这种情况下是否有特殊的内存调试方法?如有任何建议,将不胜感激。

1 回复 | 直到 6 年前

damienfrancois 6 年前

你可以通过使用 srun 要启动python脚本:

srun python $NORM_SCRIPT -data $file -path $OUTPUT_DIR

sacct 命令。

如果由管理员配置,请使用 --profile 选项以获取每个步骤的内存使用时间线。

memory_profile 模块获取脚本内存使用情况的反馈。

推荐文章

Community wiki · 如何调试Python内存故障?

1 年前

tuskiomi · 如何为参考提供明确的锈蚀寿命?

2 年前

cobb208 · Malloc正在为释放指针引发错误

2 年前

mo FEAR · C++ STL映射是否在创建后移动了一个值的位置?

2 年前

Pooyanoss · 覆盖类的堆栈分配实例

2 年前

TheKing · 为什么数组的地址可以有负值?

2 年前

Http2inc · 如何从内存中解析这些二进制数据?

2 年前

tifrel · 如何检查已编译类型的表示形式?

2 年前

Gabriele · 释放GSL矩阵的正确方法是什么?

6 年前

Makogan · 3D纹理大小影响程序输出,不会引发错误

6 年前